組織におけるセキュリティ、ガバナンス、コンプライアンスの概念
- セキュリティ: 組織のデータ、情報アセット、インフラストラクチャの機密性、完全性、可用性を確保する。この機能は組織において一般的に情報セキュリティやサイバーセキュリティと呼ばれる。
- ガバナンス: 組織がビジネスオペレーションにおいて、価値を提供すると同時に、リスクを管理できるようにする。
- コンプライアンス: 組織の機能全体にわたって確実かつ規範的に要件に準拠する。
多層防御
- データ保護: 保管中のすべてのデータを AWS Key Management Service (AWS KMS) またはカスタマーマネージドキーで暗号化します。
- アイデンティティとアクセスの管理: 認可されたユーザー、アプリケーション、サービスのみが、クラウドインフラストラクチャとそのサービスにアクセスして操作できるよう管理します。
- アプリケーションの保護: AWS は、アプリケーションを保護するためのサービスを複数提供しています。AWS Shield, Amazon Cognito, etc
- ネットワークとエッジの保護: ネットワークとエッジの保護を提供する AWS のサービスには、以下のようなものがあります。Amazon Virtual Private Cloud, AWS WAF
- インフラストラクチャの保護: インフラストラクチャを保護するための AWS のサービスと機能には、以下のようなものがあります。AWS Identity and Access Management IAM ユーザーグループとネットワークアクセスコントロールリスト (ネットワーク ACL)
- 脅威の検出とインシデント対応: AWS Security Hub, Amazon GuardDuty, AWS Lambda, Amazon EventBridge
- ポリシー、手順、認知: AWS Identity and Access Management Access Analyzer を使用して最小権限のポリシーを実装し、アクセス権限が過度に付与されているアカウント、ロール、リソースがないかどうかを確認します。
ガバナンスとコンプライアンスの大まかな戦略
- AI ガバナンスフレームワークを確立する
- AI コンプライアンスに関する考慮事項に取り組む
AI システムのガバナンスとコンプライアンスの重要性
ガバナンスの視点において重要な要素となるのは、組織の AI イニシアチブの管理、最適化、スケーリングです。
ガバナンスとコンプライアンスは、ビジネスの AI システムにおいて、責任、信頼性のある方法で AI を使用するうえで重要です。
ガバナンスが存在することで、組織は明確なポリシー、ガイドライン、監視メカニズムを確立して、倫理原則や社会的価値だけでなく
AWS コンプライアンス
AI システムに適用される可能性のある特定のセキュリティ基準
- NIST 800-53
- 欧州連合サイバーセキュリティ機関 (ENISA)
- ISO/IEC 27002 ベストプラクティス
- AWS System and Organization Controls (SOC) レポート
- Architecting for HIPAA Security and Compliance on Amazon Web Services(opens in a new tab)
- GDPR
- PCI DSS
AI 標準へのコンプライアンス
考慮すべき問題
- 複雑性と不透明性
- ダイナミズムと適応性: AI システムは動的であることが多く、デプロイ後も、時間経過とともに状況に適応して変化する場合があるため、静的な標準、フレームワーク、義務を適用することが困難です。
- 突発的に発生する機能: AI システム内の複雑なインタラクションの結果として発生する、予期しない機能や、意図しない機能のことです。
- 固有のリスク: AI によって、アルゴリズムバイアス、プライバシー侵害、誤情報、AI を活用した自動化によって人間の仕事が奪われることなど、新たなリスクが生まれます
- アルゴリズムの説明責任: アルゴリズム、特に AI システムで使用されるアルゴリズムは、透明性があり、説明可能で、監視と説明責任対策の対象となるべきであるという考え方のことです。
AWS のガバナンスとコンプライアンス
AWS は、ガバナンスと規制へのコンプライアンスを支援するサービスと機能を多数用意しています。
- AWS Config: リソース管理: , 監査とコンプライアンス, 設定変更の管理とトラブルシューティング。アカウント内で AWS リソースがどのように構成されているかを詳しく見ることができます。AWS Config は、AWS リソースの相互接続と過去の構成を図示します。AWS Config を使用して、時間の経過に伴う構成や関係の変化をモニタリングできます。
- Amazon Inspector: パッケージの脆弱性, コードの脆弱性, ネットワーク到達可能性。mazon Inspector は脆弱性管理サービスです。ワークロードを継続的にスキャンし、ソフトウェアの脆弱性や意図しないネットワークへの露出がないか調べます。EC2 インスタンスと Amazon ECR リポジトリを評価して、詳しい検出結果と改善のための推奨事項を提示できます。
- AWS Audit Manage:AWS の使用状況を継続的に監査して、リスクとコンプライアンスの評価を簡素化Audit Manager を使用して証拠を収集し、監査データを管理する方法
- AWS Artifact : AWS ISO 認証、PCI レポート、SOC レポートなど、AWS のセキュリティとコンプライアンスに関するドキュメントをオンデマンドでダウンロードできます。 AWS Marketplace で製品を販売する ISV のデューデリジェンスを実施する際に使用され、ISV の発行するセキュリティとコンプライアンスレポートへのアクセスをオンデマンドで提供します。
- AWS CloudTrail : AWS アカウントに対して、運用とリスクの監査、ガバナンス、コンプライアンスを実施できるよう支援します。CloudTrail を使用すると、AWS アカウントの API コールをモニタリングして、ログに記録できます。
- AWS Trusted Advisor: コストの最適化、パフォーマンスの向上、セキュリティと耐障害性の強化、クラウドでの大規模な運用を支援します。
データガバナンス戦略
AI と生成 AI のワークロードのデータガバナンス戦略には、データの収集と保管から、データの使用およびセキュリティに至るまで、データライフサイクルの管理方法が関係しています
- データの品質と整合性
- データ保護とプライバシー
- データライフサイクル管理
- 責任ある AI
- ガバナンスの構造と役割
- データの共有とコラボレーション
データ管理の概念
以下の概念はすべて、AI ワークロードを適切に管理およびデプロイするための重要な考慮事項です。
- データライフサイクル
- データロギング
- データレジデンシー
- データモニタリング
- データ分析
- データ保持
ガバナンス戦略へのアプローチ
- ポリシー
- レビュー頻度
- レビュー戦略
- 透明性の基準
- チームトレーニング要件
モニタリング
AI システムのモニタリングは、パフォーマンスや信頼性を担保したり、目的のユースケースへのコンプライアンスを確保したりするうえで重要です。
AI システムをモニタリングする際に考慮すべき重要な点を以下に示します。
- パフォーマンスメトリクス
- インフラストラクチャのモニタリング
- バイアスと公平性のモニタリング
- コンプライアンスや責任ある AIのモニタリング
-
セキュリティ原則
- ガバナンスとコンプライアンス
- 法律、プライバシー
- リスク管理
- コントロールと耐障害性
AI システムのセキュリティとプライバシーに関する考慮事項
セキュリティに関する考慮事項
- 脅威の検出
- 脆弱性管理
- インフラストラクチャの保護
- プロンプトインジェクション対策
- データ暗号化
AI システムを保護するための AWS のサービス
- Security Hub: 1 つのダッシュボードでセキュリティに関する検出結果すべてを表示したり、自動プレイブックを作成して実行したりできます。
- AWS KMS: AWS KMS はデータを暗号化します。
- GuardDuty: 不審なアクティビティや不正な動作がないかモニタリングして、AWS アカウント、ワークロード、データを保護する脅威検出サービスです。
- AWS Shield Advanced: 分散サービス妨害 (DDoS) イベントからワークロードを保護するのに役立ちます。
Amazon Macie は、ML を使用して大規模な機密データ検出を自動化します。
Macie を使用すると、Amazon S3 に保存されている機密データを検出、分類、保護できます。Macie はデータセキュリティに役立ちます。ただし、Macie が主に着目しているのは、保管中のデータです。Macie を使用して、Amazon Bedrock へのアクセスや運用を保護することはできません。
AWS Identity and Access Management (AWS IAM) を使用すると、AWS のサービスやリソースにアクセスできるエンティティを指定できます。
AWS IAM アイデンティティセンターと IAM Access Analyzer を使用して、最小権限のポリシーをトレーニングデータ、モデル、アプリケーションに適用します。アクセスの制限に使用できるその他のサービスを紹介します。
AI システムからのデータの入出力を強力にコントロールするために、厳格な AWS Network Firewall および Amazon VPC のポリシーを定義できます。
Amazon GuardDuty に加え、Amazon Inspector と Amazon Detective もインテリジェントな脅威検出に役立ちます。これらのサービスにより、AWS 認証情報の窃取 (盗難) などの不審なアクティビティや、ユーザーによる API (Amazon Bedrock や Amazon SageMaker の API) の不審な使用を特定できます。Amazon Inspector と Amazon Detective について以下に簡単に説明します。
インシデント対応とコンプライアンスを自動化するには、ここまでに学習した、次のような AWS のサービスを使用します。
- AWS Security Hub
- AWS Config
- AWS Audit Manager
- AWS Artifact
ここまでに学習した AWS Shield Advanced と AWS Firewall Manager に加え、AWS WAF を使用してウェブアプリケーションとデータを保護することもできます。
データとモデルの系統を理解する
出典を引用し、データの起源を記録することは、AI システムを保護するうえで欠かせないタスクです。
- 出典の引用
- 生成 AI における出典の引用とは、モデルのトレーニングに使用されたデータを出典と適切に関連付け、その出典を明示することです。
- トレーニングデータの収集元として、以下のような出典を特定する必要があります。
- データの起源を記録
- データ収集プロセスの詳細
- データのキュレーションとクリーニングに使用された方法
- データに適用されたすべての前処理や変換
ツールと手法
- データリネージ: データの起源、変換、さまざまなシステム間での移動など、データの履歴の追跡に使用される手法です。
- カタログ作: 生成 AI システムの開発に使用されるデータセット、モデル、その他のリソースを体系的に整理して記録することです。
- モデルカード: ML モデルに関する重要な詳細情報 (対象用途、パフォーマンス特性、潜在的な制限など) を文書化するための標準化された形式です。Amazon SageMaker Model Cards
データエンジニアリングのライフサイクルとは
- オートメーションとアクセスコントロール
- データ収集
- データの準備とクリーニング: Amazon EMR, AWS Glue
- データ品質のチェック: AWS Glue DataBrew, AWS Glue Data Quality
- データの可視化と分析: Amazon QuickSight , Amazon Neptune
- IaC デプロイ
- モニタリングとデバッグ: Amazon CloudWatch
安全なデータエンジニアリング
- データ品質を評価
- プライバシー強化テクノロジーを実装: データマスキング、データ難読化、差分プライバシー, 暗号化、トークン化、安全なマルチパーティー計算を
- データへのアクセスをコントロール
- データの整合性
参考文献
Security, Compliance, and Governance for AI Solutions