株式会社ずんだもん技術室AI放送局 cover art

株式会社ずんだもん技術室AI放送局

株式会社ずんだもん技術室AI放送局

By: 株式会社ずんだもん技術室AI放送局
Listen for free

About this listen

AIやテクノロジーのトレンドを届けるPodcast。平日毎朝6時配信。朝の通勤時間や支度中に情報キャッチアップとして聞いてほしいのだ。(MC 月:春日部つむぎ、火水木:ずんだもん、金:お嬢様ずんだもん)
Episodes
  • 株式会社ずんだもん技術室AI放送局 podcast 20260303
    Mar 2 2026
    youtube版(スライド付き) 関連リンク Microsoft Copilot Tasks発表、AIが「答える」から「実行する」時代へ Microsoftは2026年2月26日、AIアシスタントCopilotの新機能「Copilot Tasks」を発表しました。これまでの生成AIは、ユーザーの問いに対してテキストや画像で「答える」ことが中心でしたが、今回のアップデートは、AIがユーザーに代わって自律的にタスクを「実行する」エージェント型AI(AI Agent)への大きな転換を意味しています。 ■ 主な機能とユースケース Copilot Tasksは、自然言語で指示を与えるだけで、AIがバックグラウンドでタスクを分解・実行し、結果を報告します。主なユースケースとして、定期タスクの自動化、ドキュメント作成、予約や買い物の代行、ロジスティクスの最適化などが挙げられます。なお、支払いやメッセージ送信といった重要なアクションには、ユーザーの同意を必要とする「Human-in-the-loop」の設計が採用されています。 ■ エンジニアが注目すべき「クラウドサンドボックス」構造 技術的な側面で最も重要なのは、その実行環境の設計です。Copilot Tasksは、Microsoftのクラウド上に隔離された「仮想実行環境(サンドボックス)」でタスクを処理します。 2026年初頭、ローカルPC上で直接コマンドを実行するオープンソースのエージェント「OpenClaw」が、深刻な脆弱性を多数指摘され「セキュリティ上の悪夢」と評された事例がありました。これに対し、Microsoftはエージェントの実行場所をクラウド側に封じ込めることで、ユーザーのデバイスへの直接的なリスクを抑え、認証情報の漏洩やシステム乗っ取りを防ぐアーキテクチャを選択しました。 ■ 業界の動向と今後の展望 現在、AI業界は「エージェント型」の激戦区となっています。同時期にOpenAIは「Operator」を、GoogleはAndroid向けの「Geminiエージェント」を展開しており、AIがブラウザやアプリを直接操作する時代が本格的に到来しました。 今後の開発においては、単に「正解を出す」だけでなく、外部サイトの悪意ある記述による「プロンプトインジェクション」への対策や、AIが行ったアクションの責任の所在、監査ログの透明性といった「信頼性エンジニアリング」が競争力の鍵となります。 新人エンジニアの皆さんは、AIを単なるチャットボットとしてではなく、クラウド上の安全な環境で外部ツールを操作する「自律的なソフトウェアコンポーネント」として捉えることで、次世代のシステム設計のヒントが得られるはずです。現在はリサーチプレビュー段階であり、今後の段階的なロールアウトが注目されます。 引用元: https://innovatopia.jp/ai/ai-news/81599/ microgpt 元OpenAIのAndrej Karpathy氏が公開した「microgpt」は、外部ライブラリを一切使用せず、わずか200行の純粋なPythonコードだけでGPTの学習と推論を実現した教育的プロジェクトです。LLM(大規模言語モデル)の仕組みを極限までシンプルに削ぎ落とし、その「アルゴリズムの本質」を1つのファイルに凝縮しています。 概要 microgptは、現代のAIの核心となる技術をブラックボックスなしで実装しています。具体的には以下の要素が含まれています。 データセットとトークナイザ: テキストを読み込み、文字単位で数値(トークン)に変換する最小限の仕組み。Autograd(自動微分)エンジン: 誤差逆伝播法を実現する独自のValueクラス。PyTorchなどのライブラリが内部で行っている計算を、数学の連鎖律に基づいてゼロから記述しています。GPT-2ベースのアーキテクチャ: アテンション機構(トークン間の通信)とMLP(計算処理)を交互に配置し、残差接続やRMSNormを組み込んだ標準的なトランスフォーマー構造。学習と推論: Adamオプティマイザによるパラメータ更新と、学習した統計モデルから新しい文字列を生成(サンプリング)するループ。 本プロジェクトの制約と特徴 効率性よりも「理解のしやすさ」を最優先しているため、以下の制約があります。 ライブラリ依存なし: NumPyすら使わず、標準の数学ライブラリのみで動作します。スカラー演算: 通常、AIは行列演算で高速化しますが、本作は個々の数値を個別に計算します。そのため非常に低速ですが、デバッガで...
    Show More Show Less
    Less than 1 minute
  • マジカルラブリー☆つむぎのピュアピュアA.I.放送局 podcast 20260302
    Mar 1 2026
    関連リンク Agentic AI 101 for Advisors as Anthropic Launches Wealth Management Tools AI大手のAnthropic社が、資産管理(ウェルスマネジメント)に特化した「Claude CoWork」プラグインを発表しました。これは、単にテキストを生成するだけのAIから、自律的に業務を遂行する「エージェント型AI(Agentic AI)」への大きな転換を象徴するニュースです。 新人エンジニアがまず押さえておくべき点は、この記事で定義されている「AIエージェント」の4つの基本要素です。これらがループ(循環)することで、AIは単なるツールを超えた「デジタル労働力」として機能します。 Sense(感知): プロンプトだけでなく、メールやツール、現在の状況といった周囲のコンテキストを把握する能力。Think(思考): 目標に対し、自身の状態や環境を踏まえて「次に何をすべきか」を自律的に推論する能力。Act(実行): 他のツールの呼び出しやワークフローの起動など、実際に外部へ影響を与えるアクション。Remember(記憶): インタラクションを通じて情報を保持し、将来の行動を改善する能力。 Anthropicが提供を開始するツールは、ポートフォリオの自動分析や税務分析、さらにはリバランス(資産再配分)の推奨や実行までをスケールさせて行うことが可能です。これにより、従来アドバイザーが行っていた定型業務をAIが肩代わりし、人間はクライアントとの対話や戦略的な成長により注力できるようになります。 この動きは、テクノロジー業界の構造にも影響を与えます。これまでOpenAIやAnthropicなどの汎用LLMを「業界特化型」にカスタマイズして提供していた「AIミドルウェア」プロバイダーにとって、基盤モデル側が直接専門ツールを提供し始めることは大きな脅威となります。 一方で、企業の既存のシステム構成や固有のデータ要件に合わせてAIを調整する、コンサルティング的なアプローチを持つスタートアップの重要性も示唆されています。エンジニアにとっては、AIモデルを単に使うだけでなく、「いかに既存の業務フローに組み込み、自律的なワークフローを設計するか」というエージェント設計の視点が、今後の開発において極めて重要になるでしょう。 引用元: https://www.wealthmanagement.com/artificial-intelligence/agentic-ai-101-for-advisors-as-anthropic-launches-wealth-management-tools The Factory Model: How Coding Agents Changed Software Engineering GoogleのエンジニアであるAddy Osmani氏による、AIエージェントがソフトウェアエンジニアリングの本質をどう変えたかについての洞察です。エージェント技術の進化により、エンジニアリングの「抽象化レイヤー」が一段階上がったと述べられています。 1. ソフトウェア開発の「第3世代」へ これまでのAI活用は、コードの補完(第1世代)や、人間が指示してAIが書く同期的な共同作業(第2世代)でした。現在は、仕様を渡せば自律的に環境構築からテスト、デバッグ、プルリクエスト作成まで行う「自律型エージェント(第3世代)」の時代に突入しています。これは、アセンブリからC言語、フレームワークへと抽象化が進んできた歴史の延長線上にある正当な進化です。 2. 「ファクトリーモデル」という考え方 新しいパラダイムでは、エンジニアは「コードを書く人」から「コードを書く工場(ファクトリー)を築く人」へと役割が変わります。工場とは、複数のエージェント、ツール、コンテキスト、そしてフィードバックループの集合体です。エンジニアの仕事は、個別のコードを書くことではなく、これらのエージェントを並行して動かし、システム全体をオーケストレートすることにシフトします。 3. エンジニアに求められるスキルの変化 コードを書く「作業」は自動化されますが、エンジニアリングの「核」となるスキルはむしろ重要性が増しています。 仕様(スペック)の定義力: 曖昧な仕様は、並行して動く大量のエージェントによって「曖昧な失敗」として増幅されます。何が成功かを明確に定義する力が最大のレバレッジになります。TDD(テスト駆動開発)の徹底: AIが生成したコードが正しいかを検証するには、実装より先にテストを書くTDDが不可欠です。テストこそがエージェントを...
    Show More Show Less
    Less than 1 minute
  • 私立ずんだもん女学園放送部 podcast 20260227
    Feb 26 2026
    youtube版(スライド付き) 関連リンク Boris Cherny氏がシェアした、CLAUDE.mdを理解する 本記事は、Anthropic社のスタッフエンジニアであるBoris Cherny氏が提唱した、AIコーディングエージェント「Claude Code」を最大限に活用するための設定ファイル「CLAUDE.md」の設計思想を解説したものです。このファイルは、プロジェクトのルートディレクトリに配置することで、AIに対して「チームのルール」や「作業の進め方」を伝える「外部メモリ」として機能します。新人エンジニアの方にとっても、AIを単なるチャット相手ではなく、頼れる「自律的なチームメンバー」として教育するための最高のガイドとなります。 主な要点は以下の通りです: 「Planモード」による思考の分離: 複雑なタスク(3ステップ以上の作業や設計判断)では、AIがいきなりコードを書き始めるのを防ぎ、まずは具体的な「計画」を立てさせます。人間とAIが実装方針に合意してから作業を開始することで、意図しないコードの書き換えや手戻りを最小限に抑えます。 「サブエージェント」によるコンテキスト管理: AIが一度に保持できる記憶容量(コンテキストウィンドウ)には限りがあります。リサーチや並列分析などの重いタスクは、別のAIインスタンス(サブエージェント)に切り出して分担させることで、メインの作業環境をクリーンに保ち、思考の精度を維持します。 「自己改善ループ」の構築: 人間がAIのミスを修正した際、その教訓をtasks/lessons.mdというファイルにパターンとして記録させます。これをAIに随時参照させることで、セッションをまたいでも同じ失敗を繰り返さない「成長するAI」を実現します。 品質担保の徹底と自律的なバグ修正: テストやログによる動作証明ができるまで「完了」と見なさない厳格なルールを設けます。また、バグ報告に対しては、人間に指示を仰ぐのではなく、AI自らがログを確認して自律的に解決(Zero context switching)することを目指します。 コア原則(シンプル・根本解決・最小影響): 過剰な設計を避け、一時しのぎではない根本的な原因解決を行い、必要な箇所だけを変更するという、シニアエンジニア基準の品質をAIに求めます。 これらの指針をCLAUDE.mdに定義することで、AIの自律性を引き出し、開発チーム全体の生産性を劇的に向上させることが可能になります。 引用元: https://qiita.com/uno_ha07/items/5820d195510861b5be71 入社前から自分の仕事を奪うセキュリティレビューAIエージェントを作った 本記事は、Sansan株式会社のプロダクトセキュリティグループでインターンを経験した学生が、セキュリティ設計レビューを自動化するAIエージェント「Hayami」を開発した事例を紹介しています。 1. セキュリティ設計レビューの課題 セキュリティ設計レビューとは、開発者が実装に入る前に設計書を確認し、セキュリティ上の懸念を洗い出す工程(シフトレフト)です。Sansanでは、160項目を超える社内ガイドラインとの照合を少人数で対応しており、以下の課題を抱えていました。 網羅性の担保: 膨大なガイドラインを全ての案件で手動チェックするのは限界がある。生産性のボトルネック: 開発側のスピードがAI活用で加速する中、レビューが遅延すると組織全体の生産性を下げてしまう。 2. なぜ独自開発か(AWS Security Agentとの比較) 既存の「AWS Security Agent」も検討されましたが、以下の理由から独自開発の「Hayami」が採用されました。 カスタマイズ性: 頻繁に更新される160以上の社内ガイドラインを、既存ツールに適応させ続ける運用コストが高い。ワークフローの統合: Slackをベースとした既存の依頼フローや、レビュー対象の判定基準といった独自の運用に柔軟に組み込む必要があった。 3. AIエージェント「Hayami」の実力 Hayamiは、Slackから設計書とガイドラインを読み込み、LLM(大規模言語モデル)を用いて分析結果を出力します。 高い精度: ベンチマーク測定の結果、社内ガイドラインへの適合率は95.8%に達し、セキュリティで最も回避すべき「抜け漏れ」は0%を記録しました。リードタイム削減: 初動のレビューコメントをAIが代行することで、レビュー終了までの時間を最大18.76...
    Show More Show Less
    Less than 1 minute
No reviews yet
In the spirit of reconciliation, Audible acknowledges the Traditional Custodians of country throughout Australia and their connections to land, sea and community. We pay our respect to their elders past and present and extend that respect to all Aboriginal and Torres Strait Islander peoples today.