生成 AI アプリケーションのライフサイクル
- ユースケースの定義
- 解決すべき問題の定義
- 関連する要件の収集
- ステークホルダーの認識の統一
- 主なメトリクス
- コスト削減
- 時間節約
- 品質向上
- 顧客満足度
- 生産性の向上
- アプローチ
- プロセスオートメーション
- 意思決定の強化
- パーソナライズとカスタマイズ
- クリエイティブなコンテンツの生成
- 探索的分析とイノベーション
- 基盤モデルの選択
- トレーニング済みモデルの選択基準
- コスト
- モダリティ: 生成 AI モデルは、テキスト生成、画像生成、音声生成、マルチモーダル生成 (複数のモダリティの組み合わせ) など、さまざまなモダリティに合わせて設計できます
- レイテンシー
- 多言語サポート
- モデルのサイズ
- モデルの複雑さ
- カスタマイズ
- 入出力の長さ
- 責任に関する検討事項: バイアスの可能性、誤情報のリスク、誤用など、トレーニング済み生成 AI モデルを使用することによる責任への影響を評価することが重要
- デプロイと統合
- パフォーマンスの改善
- プロンプトエンジニアリング
- ゼロショットプロンプティング
- フューショットプロンプティング
- 思考の連鎖 (CoT) プロンプティング
- 自己整合性
- 思考の木 (ToT)
- 検索拡張生成 (RAG) : 取得システムと生成言語モデルを使用します。取得システムは、膨大な量の事実知識と情報へのアクセスを提供します。また、生成言語モデルは、特定の入力やコンテキストに合わせて、自然で一貫性のある方法でこれらの情報を合成して提示できます。RAG は、LLM のトレーニングデータソースの外部にあるナレッジベースを参照することにより、LLM の品質と一貫性を向上させるプロセスです。RAG は、回答を生成する前に外部のナレッジベースを参照します。RAG を使用すれば、モデルから外部のナレッジソースにアクセスできるようになり、開発の労力も最小限で済みます。
- RAG ビジネスアプリケーション
- インテリジェントな質問応答システムの構築
- 既存のナレッジベースの拡張と拡充
- 高品質のコンテンツの生成
- Automatic Reasoning and Tool-use (ART)
- ReAct プロンプティング
- ファインチューニング
- インストラクションファインチューニング: モデルが特定の命令にどのように応答するかを示す例を使用します。
- 人間のフィードバックによる強化学習 (RLHF)
- 基盤モデルをゼロから作成する
- 結果の評価
- 人間による評価
- ベンチマークデータセット:言語モデルやその他の AI システムのパフォーマンスを評価するために特別に設計され、キュレートされたデータを集めたものです。
- 自動化されたメトリクス
- パープレキシティ (モデルが次のトークンをどれくらい適切に予測するかを示す測定値)
- BLEU スコア (機械翻訳の評価)
- F1 スコア (分類タスクまたはエンティティ認識タスクの評価。適合率と再現率を使用して、モデルによる適正なクラスへの分類の正解率を評価します。)
- Recall-Oriented Understudy for Gisting Evaluation (ROUGE): 自動要約システムや機械翻訳システムを評価するために使用される。テキスト要約とテキスト生成の品質評価に使用できるメトリクスです。
- BERTScore: 生成されたテキストと 1 つ以上の基準テキストの間のセマンティック類似度を評価。Text-to-Text 言語モデルが生成するテキストの品質評価に使用できるメトリクスです。生成されたテキストとリファレンステキストの間のセマンティックな類似性を測定します。したがって、BERTScore を使用すると、チャットボットと人間の応答の類似性を評価できます。
- デプロイ
- コスト: 使用したリソースの料金を支払います。最低料金はありません。
- リージョン: モデルのデプロイは特定の AWS リージョンに限定されます。
- クォータ: AWS アカウントに十分なサービスリソースがあることを確認してください。
- セキュリティ:
参考文献
Developing Generative AI Solutions