Vision

Vision of ThinkNavi

GPT、Claude、Geminiなどの大手汎用AIサービスは、あまねくAI機能を提供するインフラとして発展していくものと見られます。それに対して個別の企業や個人がAIを活用する場面では、個々のアプリケーションやタスクにAIを適用する手段としてAIエージェントが活用されるようになることがほぼ確定的と見なされつつあります。AIエージェントは、単なる自動化ではなく、ユーザーの大まかな指示に従って、自律的に状況判断し、状況に応じて柔軟にタスクを実行する能力を有します。汎用的なAIと個別のタスクに対応したAIエージェントによって、世の中の隅から隅までAIが浸透していく未来像が多くの人々に共有されています。

しかしながら、果たしてそれでAIは人間が望むように働いてくれるのでしょうか?AIが正しく動作して人間に予期しない損害を与えないようにする枠組みとして“AIガバナンス“が議論されています。今のところ、おもに法制度や運用上のルールづくりのような側面が協調されているようです。マインドウエア総研では、ここにAIと人間のインタフェースを組み込むことを提案します。

現在のAIは人工ニューラルネットワークの深層学習という技術によって実現されています。長年、小規模なネットワークで動かしていたものを近年になって大規模化したことで、現在のような発展を見るに至りました。ただし、深層学習の内部処理がブラックボックスで人間には理解できないという問題は未解決のまま(すなわち、安全性が確認されないまま)、莫大な投資が行なわれ実用化がどんどん進められております。著名なAI研究者がその状況に危機感を覚え、次々と大手AI企業から去っているという実態が報道されているのは周知のとおりです。

AI技術には深層学習だけでなく、自己組織化マップ(SOM)やベイジアン信念ネットワーク(BBN)などの説明可能なAI技術のファミリーもあります。マインドウェア総研の主張は、深層学習一辺倒ではなく、深層学習とこれらの説明可能AIを組み合わせることによって、AIを”制御可能“にすることが何よりも重要だというものです。LLMによりAIが人間の言葉を理解するように見えているのですが、人間が言葉で命令しても、AIがそのとおりに動くかどうかということがここで問題になっているのですから、自然言語ではなく数理的な方法でAIとコミュニケーションをとることが必要になります。それができるのが説明可能AIなのです。

数千次元の埋め込みベクトルを使って、AIとコミュニケーションする説明可能AIとして、マインドウェア総研では成長ニューラルガス(GNG)と呼ばれるSOMの発展形を使用することにいました。伝統的なSOMではトポロジーが2次元に固定されているため、超多次元のデータを要約するには限界があるためです。ただし、GNGもSOMと同様、データに含まれる”概念”を表現します。また、モデル内の特定のノードに人間の”意思”とか”戦略”を定義することに使えます。それを深層学習型のAIが読み取ることでAIと人間との数理的コミュニケーションが成立することになります。MST(最小全域木)はGNGのノードを繋げるエッジとして使用され、これによりグラフ構造を確定します。

GNG+MSTは個別のユーザーの構造化された”長期記憶”としての働きを持ちます。これは、新しいデータの入力に対して、過去の記憶に基づいて適切な判断を行うための基盤となります。たとえば顧客からのメールを受信すると、その顧客との過去のやりとりを見て、それに応じた返答を行うことを目指しています。現状のAIエージェントでは、ごく簡単な判断なら行うことができるかもしれませんが、過去の記憶に基づいた判断というレベルに到達するには、構造化された記憶モデルが必要で、それは現状のAIエージェントには実装されていません。

今後、LLMなどの汎用AI側でも個別のユーザーに関する記憶を持つことになるでしょうが、すべての判断を汎用AIに任せるのは危険だと考えられます。企業などのユーザー側で自身の戦略モデルをAIと相互運用可能な形式で実装することが不可欠となります。マインドウエア総研は、AIユーザーが主体的にAIを活用し、AIを制御可能なものにするお手伝いを致します。