こんにちは。クラウドネイティブ技術部の野中です。
2024年12月2日から12月6日にかけて開催されている re:Invent 2024 に現地で参加しております。
今回、生成AIの最新情報や実際の活用事例を取り上げた日本語セッションに参加しました。
このセッションを選んだ理由は、現在担当しているRAG(Retrieval-Augmented Generation)を活用した社内文書検索システム構築のプロジェクトにおいて、ここで得た知見を何かしら活かせられればと考えたからです。
1. 生成AI活用の最前線:業務効率化と価値創出の可能性
2024年も終わりに近づき、多くの企業で生成AIの活用が進む中、私たちもこの波を捉え、さまざまなプロジェクトを推進しています。
新しい体験の提供
データ利活用
- 企業内のデータを最大限に活用し、顧客にユニークで個別化された体験を提供する取り組みが進行中。
- 特に、企業内の非構造化データや既存のナレッジベースを活用した新しいサービスや製品の開発が注目されています。
マルチモーダルの対応
- テキストに加えて、画像・動画・音声といった複数のメディアに対応可能な生成AIの利用が拡大しています。
- これにより、より直感的で使いやすいユーザー体験が可能になり、多様な顧客ニーズに応えることが期待されています。
生産性の向上
開発支援
- ソフトウェア開発において、生成AIを利用したコード自動生成やエラー修正の提案機能が、開発フェーズの効率化を実現しています。
- この結果、開発者はよりクリエイティブな課題に集中することが可能になります。
クリエーター支援
- 会話やシナリオ、画像、動画、音楽など、さまざまなコンテンツの生成をAIがサポート。
- 新しいアイデアの創出や、迅速なプロトタイプ作成を支える重要なツールとして、クリエイティブな業務の幅を広げています。
2. 生成AI活用の背景と導入のポイント
生成AIは、従来のAI技術と異なり、単に分析や予測を行うだけでなく、新たなデータやコンテンツを「生成」する能力を持ちます。これにより、次のような活用が期待されています。
i. 業務効率化
- データ処理やコンテンツ生成の自動化。
- 従来人手が必要だったタスクをAIが補完する形での分担。
- 例: 生成AIを用いた顧客メールの自動作成や定型レポートの生成。
ii. 新しい顧客体験の創出
- マルチモーダル(テキスト、画像、音声、動画)対応のコンテンツ生成。
- パーソナライズされた体験の提供。
- 例: 顧客の過去の購入履歴や問い合わせ履歴をもとに、個別化された提案を自動生成。
iii. イノベーションの加速
- 企業独自のデータを活用した差別化モデルの開発。
- 社員が生成AIを用いて独自のアプリケーションを開発可能なプラットフォーム構築。
- 例: 社内ナレッジベースの文書を分析して、プロジェクト提案書の雛形を自動生成。
3. 技術的なアプローチ
生成AIを実用化するには、いくつかの技術的ステップを踏む必要があります。ここでは技術的なアプローチを紹介します。
i. データ収集と前処理
生成AIの成功には、高品質で適切なデータセットの用意が不可欠です。以下の技術やサービスが活用されています。
- データコネクタ:
- サードパーティデータソースからデータを収集し、AIの処理に適した形式で取り込む技術。
- Amazon AppFlow: SalesforceやGoogle WorkspaceからデータをAWSに安全に転送。リアルタイム同期も可能。
- AWS Glue Data Catalog: データのスキーマを一元管理し、他のAWSサービスとの連携を効率化。
- Azure Data Factory: 異なるデータソースを統合し、パイプラインを構築可能。
- サードパーティデータソースからデータを収集し、AIの処理に適した形式で取り込む技術。
- データクレンジング:
- データの品質を向上させ、AI処理の精度を高めるためのプロセス。
- AWS Glue: データの変換・統合・フィルタリングを自動化するETLジョブを構築可能。
- Google Cloud Dataprep: ノーコードでのデータクリーニングを可能にするサービス。
- データの品質を向上させ、AI処理の精度を高めるためのプロセス。
ii. モデル選定とファインチューニング
生成AIモデルには、大規模言語モデル(LLM)や特化型モデルがあり、ユースケースに応じた選択が求められます。
- ファインチューニング:
Amazon SageMakerを使用して、企業固有のデータを学習させることで、特定業務に最適化されたモデルを構築。- 例: 医療業界向けの専門用語を学習したカスタムモデルの作成。
- RAG(Retrieval-Augmented Generation):
Amazon BedrockやKendraを活用し、基盤モデルと企業データを組み合わせることで、高度な文脈対応を可能にする手法。
iii. システムアーキテクチャの最適化
生成AIは高い計算リソースを要するため、効率的なシステム設計が重要です。
- マイクロサービスアーキテクチャ:
各AI機能を独立してスケール可能な構造に分離。 - フルマネージドサービスの活用:
- Amazon Bedrock: 複数の基盤モデルを統合管理し、柔軟な応答生成を実現。
- AWS Lambda: サーバーレスでオンデマンド処理を実行し、運用コストを削減。※Lambdaの制約を超える処理についてはECS等を活用
- Amazon API Gateway: RESTful APIを構築し、外部アプリケーションとの統合を容易に。
4. ユースケース事例:企業の生成AI活用から学ぶ
以下は、セッションで紹介された生成AIの具体的な活用事例です。
i. 広告業界での効率化と価値創出
生成AIを活用して、広告制作やキャンペーン管理の効率化を実現しています。
- 広告素材の自動生成
リアルタイムでの素材生成を可能にし、SNSキャンペーンのレスポンスを向上。AIが盛り上がる瞬間を検出して、即座にハイライト映像を切り出し。 - データ分析による提案最適化
広告主の過去データをAIで解析し、最適なキャンペーン提案を自動生成。
ii. スポーツ分野での観客体験向上
スポーツハイライト映像を自動生成し、観客のエンゲージメントを向上。
- リアルタイムハイライト生成
ゴールシーンや重要なプレーを自動判定してSNSに投稿。ユーザーの注目を即座に集める仕組み。 - 業務効率の改善
従来は手動で行われていたクリップ選定をAIで代替し、人的コストを削減。
iii. 社内のナレッジ管理と検索効率化
内部資料や社内データの検索性を向上し、業務効率化を支援。
- ナレッジベースの強化
複雑なデータソース(PDF、動画、音声など)を統合して検索可能に。精度の高い情報抽出を実現。 - チャット型アシスタントの導入
社員の質問に対し、最適な回答を生成するエージェントを構築。従来15分かかっていた問い合わせ対応を5分に短縮。
iv. 人事業務での生成AIアシスタント
人事役員の負担を軽減し、迅速な対応を実現。
- 回答の自動生成
質問内容に基づき、AIが最適な回答案を提示。役員は内容を確認・修正するだけで済むため、大幅な時間削減を実現。 - 特徴的な表現の再現
回答のトーンやスタイルを役員の特徴に合わせ、親近感を持たせる工夫。
5. フェンリルでのプロジェクト活用状況
現在、私は社内文書検索システムを開発するプロジェクトに携わっています。このプロジェクトでは、RAG(Retrieval-Augmented Generation)を用いて、ユーザーのクエリに対して適切な文書を検索し、回答を生成する仕組みを構築しています。データの検索部分にはAmazon Kendraを使用しており、高精度な情報検索を実現しています。
本セッションで得た知見を活かして、以下の改善を目指してプロジェクトをより良い物にしたいと考えています。
ナレッジベースの柔軟な拡張と統合
Amazon Kendraに加え、Amazon Bedrockを活用して高度な基盤モデルを導入し、カスタムデータを用いて業務特化型の知識ベースを構築。複数エージェントの効率的な管理と呼び分け
クエリの内容に応じて最適なエージェントを選択し、動的に呼び出す仕組みを取り入れ、各エージェントの特長を最大限に活かす。
6. 今後の技術開発への活用
生成AIの発展により、企業や業界全体での具体的な応用が進む中、私たちの実プロジェクトを通じて応用可能だと感じているポイントを整理しました。以下では、その中でも特に期待される活用例を示します。
i. ナレッジベースの統合管理
- 複数データソース(例: PDF、SharePoint、CRMデータ)を統一的に扱い、RAGの柔軟性をさらに向上させる基盤を構築。
ii. 高度なカスタマイズ
- Amazon Bedrockを用いて、業界特化型や企業特化型の回答生成モデルを構築。これにより、検索の精度とビジネス価値を同時に向上させることが可能になります。※ただし、モデルを特化型にカスタマイズするにはファインチューニングが必要であり、これにはコストや時間がかかる点に注意が必要です。カスタマイズが業務目標にどの程度貢献するかを事前に十分に精査することが重要です。
iii. マルチモーダル検索の実現
- Bedrock基盤を活用し、テキストデータだけでなく画像や音声データも対象とした検索機能を導入することで、より広範な情報提供を実現。
7. まとめ
今回のセッションを通じて、RAGの持つ可能性をさらに深く理解し、実案件での活用意欲が一層高まりました。特に、複数エージェントの協調や高度なナレッジベースの構築といった取り組みが、プロジェクトの成功に大きく貢献すると感じています。また、Amazon Bedrockを活用したソリューションは、将来的なシステムの拡張性や柔軟性を向上させる重要な要素だと実感しました。
生成AIやRAGは、まだ進化の途上にありますが、非常に多くの可能性を秘めています。これまで得た知見や経験を他のプロジェクトにも応用し、生成AIを活用した新しい価値創出の方法をさらに探求していきたいと考えています。