以下はhttps://www.nber.org/papers/w34054の翻訳です。
要旨
アルゴリズム取引と強化学習を統合したAIパワードトレーディングは、資本市場に著しい影響を与えてきました。本研究は、非対称な情報を持つ情報に通じた投機家間の不完全競争モデルを用いて、AIパワードトレーディング戦略が投機家の市場支配力、情報レント(情報の優位性から得られる超過利潤)、価格の情報量、および市場流動性に与える影響を探ります。
私たちの分析結果は、情報に通じたAI投機家が、たとえ共謀を「認識していなくとも」、共謀的な取引戦略を自律的に学習し、採用し得ることを示しています。これらの共謀戦略は、明示的な意思疎通や協調(従来の独占禁止法に抵触する可能性のある行為)なしに、情報に対して戦略的に過小に反応することで、競争を超える利益を獲得することを可能にします。
アルゴリズム共謀は、二つの異なるメカニズムから発生します。第一のメカニズムは、価格トリガー戦略を介した共謀(「人工知能」によるもの)であり、これは価格効率性が限定的で、情報に非対称性がある場合にのみ明確に現れます。第二のメカニズムは、均質化された学習バイアス(「人工的愚鈍さ」によるもの)に起因し、これは高い価格効率性や深刻な情報非対称性の条件下でも持続します。
その結果、AIパワードトレーディングが普及する市場では、価格の情報量と市場流動性の両方が損なわれる可能性があります。これは、「人工知能」と「人工的愚鈍さ」の両方の影響を反映していると言えるでしょう。
1. 序論
アルゴリズム取引と強化学習(RL)アルゴリズムの統合、一般にAIパワードトレーディングとして知られるこの技術は、資本市場を根本的に再構築する可能性を秘め、新たな規制上の課題を提起しています。特筆すべきは、AIパワードトレーディングボットが株式市場および外国為替市場において一貫して目覚ましい利益を上げており、その卓越した実績を通じてその実力と有効性を示している点です。¹ さらに、説得力のある調査データや業界研究²によって裏付けられているように、AIはポートフォリオ運用において非常に効果的であることが証明されており、AIアドバイザーの台頭により、アクティブ運用型株式ファンドにおいて人間のアドバイザーを凌駕しています。この注目すべき傾向は、クオンツヘッジファンドにとどまらず、ブラックロックやJPモルガンといった業界の巨大企業にも現れており、投資運用分野におけるAIパワードトレーディング戦略の重要性と広範な採用がさらに強調されています。
その結果、世界中の政策立案者、規制当局、金融市場監督機関は、AIを規制上の優先事項として認識し、金融市場におけるAI技術の適用方法に注目を集め、関連する影響を理解し、潜在的なシステミックリスクを評価しています。特に、証券取引委員会(SEC)のゲイリー・ゲンスラー委員長は、大手テクノロジー企業主導のトレーディング企業が金融セクターにおけるAI開発と応用を独占した場合、AIが世界の金融市場を不安定化させる可能性について警鐘を鳴らしています。SECにとっての課題は、AI技術の急速な導入が進む中で、競争力と効率性の高い市場を促進することにあります。AIは、他の投資家を犠牲にして洗練された投機家に利益をもたらすように最適化される可能性があり、競争と市場効率性を損なう恐れがあるためです。さらに、多くのAI推進派は、アルゴリズムは人間の意思決定に内在する無意識のバイアスなしに設計できると主張しますが、規制当局は「人工的愚鈍さ」などの要因による強化学習プロセスに内在するバイアスを認識しています。彼らは、AIがその設計者に潜むバイアスを意図せず増幅させる可能性があり、それが競争と市場効率性をさらに危うくする可能性があることを繰り返し強調しています。
本稿は、私的情報を持つAIパワードトレーディングアルゴリズムの行動を分析し、それが情報を持つAIトレーダーの市場支配力と資本市場全体の価格効率性に与える重大な影響を調査することを目的としています。AIアルゴリズムは単に人間の行動を模倣するものではないという点を強調することは極めて重要です。意思決定理論や心理学の文献が、経済的文脈における人間の行動をモデル化するための洞察を提供し、現代の金融研究の基礎を築いたのと同様に、AIパワードトレーディングアルゴリズムが普及する資本市場のダイナミクスを理解するには、機械の「心理」に似たアルゴリズムの行動への洞察が必要となります(Goldstein, Spatt and Ye, 2021)。
具体的には、私たちはKyle(1985)が提示した影響力のあるフレームワークを、3つの新たな側面を取り入れて拡張します。第一に、繰り返しゲームの文脈における複数の情報を持つ投機家の関与を考慮します。第二に、その純需要フローを市場の他のエージェントが吸収する必要がある、代表的な選好生息地投資家(preferred-habitat investor)を導入します。第三に、このモデルでは、Kyle(1985)に見られるような価格誤差のみに焦点を当てるのではなく、インベントリと価格誤差の両方を考慮に入れるマーケットメイカーを導入します。理論的な厳密さと実用的な関連性を組み合わせることで、私たちのモデルは、AIパワードトレーディング戦略が情報を持つトレーダーの市場支配力と価格情報量に与える深遠な影響を探るための貴重な実験室として機能します。
私たちの主な焦点は、Q学習アルゴリズムをアルゴリズム共謀とその結果として生じる価格情報量への影響を概念実証として示すことにあります。Q学習アルゴリズムは、そのシンプルさ、透明性、および経済的な解釈可能性で知られており、AI分野における重要な進歩を牽引してきたさまざまな強化学習手順のバリアントの基盤を提供してきました。
私たちの実験フレームワークでは、情報を持つAI投機家はQ学習アルゴリズムを利用して彼らの取引決定を推進します。私たちの研究には、複数の情報を持つAI投機家、代表的な選好生息地投資家、無数の無関心で均質なノイズトレーダー、そしてマーケットメイカーが含まれます。マーケットメイカーは、情報を持つAI投機家とノイズトレーダーの両方によって生成される総注文フローを綿密に監視することで、資産のファンダメンタルズ価値に関する信念を更新します。この信念形成プロセスは、過去の総注文フローと対応する資産価値を含む「履歴データ」に依存しています。さらに、マーケットメイカーは、代表的な選好生息地投資家の需要曲線(demand curve)を理解するために、統計的学習アプローチを採用しています。この理解は、選好生息地投資家の過去の注文フローと対応する資産の市場価格を含む履歴データを分析することによって達成されます。
その結果、マーケットメイカーは、データの特性に基づいた手順を利用して、資産価値の条件付き期待値と選好生息地需要曲線の推定値を適応的に構築します。驚くべきことに、私たちの発見は、このデータ駆動型の価格決定ルールが、マーケットメイカーが合理的期待を持ち、選好生息地需要曲線を熟知し、市場における情報を持つAI投機家間の共謀的行動を理解しているという仮想的なシナリオに密接に類似する価格決定ルールに自律的に収束することを示しています。この観察は、情報を持つAI投機家と選好生息地投資家が関与する複雑な市場ダイナミクスが存在するにもかかわらず、データ駆動型アプローチが価格の一貫性を達成する上で効果的であることを強調しています。
情報を持つAI投機家の行動が、アルゴリズムのインテリジェンスに起因する共謀を示しているかどうかを確かめるために、私たちはまず暗黙の共謀の基本的な理論的特性を分析することから始めます。この分析は、情報を持つ投機家とマーケットメイカーの両方が合理的期待を持ち、選好生息地需要曲線を包括的に理解していることを前提としています。私たちは、多様な市場構造と情報環境において、暗黙の共謀がどのように変化するかを強調します。この理論的調査は、非対称情報とマーケットメイカーの内生的な戦略的価格決定ルールが存在する状況での共謀行動の基礎となる理解を確立することを可能にします。
さらに、これはAI取引行動に関する私たちの実験的研究の基礎を築き、そこでは情報を持つAI投機家の観察された共謀が、合理的期待と選好生息地需要曲線の完全な知識の下での理論的予測と一致するかどうかを評価します。特に注目すべき貢献として、私たちは情報非対称性下での共謀の不可能性に関する新しい理論を確立します。この理論は、明確で直感的な視点を示しており、情報を持つ投機家は、すでにファンダメンタルズ価値を正確に反映している価格の高い効率性の水準を考慮すると、価格誤差を悪用して共謀的な結果を達成することはできないと強調しています。この理論の価値は、その理論的洞察と新規性にあります。なぜなら、これは、Abreu, Milgrom and Pearce (1991) や Sannikov and Skrzypacz (2007) が以前に提唱した製品市場競争の文脈における情報非対称性下での共謀の不可能性に関する既存の理論とは異なる、明確なメカニズムを明らかにしているからです。
さらに、別の理論的貢献として、私たちの研究は、選好生息地投資家が価格形成において実質的な役割を果たし、結果として価格が高度に効率的ではないシナリオにおいて、情報を持つ投機家間の暗黙の共謀は、価格トリガー戦略の使用を通じて維持され得ることを示しています。これらの戦略の有効性は、市場における情報非対称性のレベルが過度に深刻ではなく、情報を持つ投機家の数が過度に多くないことに依存します。加えて、情報を持つ投機家の数が減少したり、情報非対称性が減少したり、主観的な時間選好率(「忍耐のなさ」)が低下したり、選好生息地需要の弾力性が上昇したりすると、共謀能力が増加し、価格情報量が減少することを示しています。
私たちの数値的発見は、情報を持つAI投機家が、独占禁止法に抵触するような明示的な協調がなくても、戦略的に過度に低い注文フローを操作することで共謀し、競争を超える利益を達成できるという説得力のある証拠を提供しています。複数の企業が市場内で活動する際の共謀における情報交換の重要性は、実験経済学やゲーム理論の既存の研究で十分に確立されています。この重要なアイデアを示すために、私たちは意図的に、より広範な過去のデータや自身の注文フロー情報を組み込むことなく、1期前の資産価格のみに依存する比較的単純なQ学習アルゴリズムに焦点を当てました。驚くべきことに、私たちの研究は、取引環境がAIアルゴリズムに対して過度に複雑である場合、これらのアルゴリズムがわずか1期分の履歴価格を使用して知的に通信し、協力できることを示しています。これらのアルゴリズム共謀は、多様な市場構造と情報環境において、理論が予測するものと全く同じように振る舞います。さらに驚くべきことに、取引環境がAIアルゴリズムにとってあまりにも困難または複雑なシナリオでも、アルゴリズムが同じように単純である限り、情報を持つAI投機家は共謀し、過度に低い注文フローを操作することで競争を超える利益を達成できます。したがって、アルゴリズム共謀の出現は、二つの異なる源泉またはメカニズムに起因すると考えられます。
アルゴリズム共謀の二つのメカニズム
価格トリガー戦略によるアルゴリズム共謀(「人工知能」による共謀)
第一のメカニズム、価格トリガー戦略によるアルゴリズム共謀、または「人工知能」に起因する共謀として知られるこのメカニズムは、情報を持つ投機家とマーケットメイカーの両方が合理的期待を持ち、選好生息地需要曲線を包括的に理解している場合の、その理論的対応物、すなわち価格トリガー戦略による共謀に類似しています。情報を持つAI投機家の一人が、合意された共謀的な注文フローレベルから意図的またはランダムにその規模を増大させて逸脱すると、資産価格は他の情報を持つAI投機家にとって不利な反応を示します。結果として、彼らは異なる注文フローレベルを選択することで自身のパフォーマンスを最適化しようとし、しばしばより攻撃的なアプローチにつながります。これは今度は、逸脱した情報を持つAI投機家に悪影響を与えます。アルゴリズム共謀と経済的共謀の根底にあるメカニズムは異なるかもしれませんが、どちらも価格トリガー戦略を介しているにもかかわらず、結果として生じるパターンは顕著な類似性を示します。どちらの中心にも、処罰の脅威は、個々の投機家が共謀を破り、より高い利益を追求することを阻止する抑止力として効果的に機能します。
価格トリガー戦略によるアルゴリズム共謀は、価格情報量に関して逆説的な状況をもたらします。この逆説は、価格トリガー戦略によるアルゴリズム共謀が価格の情報量、具体的には情報を持つAI投機家が観察された価格から他の情報を持つAI投機家の注文フローを推測する能力に依存しているために生じます。価格情報量が高い場合、情報を持つAI投機家は他者の注文フローを正確に推測しやすくなり、その結果、アルゴリズム共謀が促進されます。価格が新しい情報に敏感で、主にノイズ取引フローによって駆動されないという強い価格情報量の存在が、情報を持つAIトレーダーが互いの注文フローを識別することをより容易にするため、この逆説が生じます。他者の行動を推測するこの能力の向上は、投機家間の共謀を強化します。しかし、共謀が強化されるにつれて、市場全体の価格情報量は損なわれることになります。情報を持つAI投機家間の共謀は、価格の情報内容を歪め、基になるファンダメンタルズを正確に反映する能力を低下させ、価格形成の効率性を妨げます。結果として、AIパワードトレーディングが普及し、価格トリガー戦略によるアルゴリズム共謀が存在する資本市場では、完璧な価格情報量や完璧な価格効率性は達成不可能となります。
学習バイアス(「人工的愚鈍さ」)と均質化によるアルゴリズム共謀
第二のメカニズムは、学習バイアス(時に「人工的愚鈍さ」とも呼ばれる)と均質化によるアルゴリズム共謀と呼ばれ、ハブ・アンド・スポーク型の共謀に依存しています。学習バイアスがアルゴリズムの本質的な不完全性に起因するにもかかわらず、情報を持つ投機家は、表面的には競合しているにもかかわらず、共有されたこれらの偏ったアルゴリズムを利用して競争を超える利益を維持する可能性があります。これはハブ・アンド・スポーク型共謀の一形態です。Johnson and Sokol (2021) は、Eコマースプラットフォームの文脈における、この「ハブ・アンド・スポーク」型のAI駆動型アルゴリズム共謀の普及を強調しています。
この共謀は、情報を持つ投機家が、そのAI駆動型取引システムを同じ基盤モデルに基づいている場合に表面化する傾向があり、Bommasani et al. (2022) などが指摘するように、高いレベルの均質化につながる可能性があります。Q学習プロセスの文脈では、学習バイアスの出現は、統計的学習における矛盾に直接的に結びついており、これは利用の結果として生じます。この本質的に偏ったアルゴリズムは、情報を持つ投機家が、非共謀的な競争設定における最適な取引戦略と比較して、取引において自身の私的情報に対して過小に反応することを促します。このような過小反応は、競争を超える利益の実現につながる可能性があり、投機家の間でアルゴリズムの使用が広範に均質化されている場合に、より発生しやすくなります。この状況は、他の投機家が優れたアルゴリズムを利用して優位性を得ようとしない場合に、さらに複雑になります。
脚注:
¹ Meta Trade Botが最近の例として挙げられる。メディアによると、この洗練されたクラウドホスト型AI取引システムは、数年間にわたる綿密な開発とテストを経て、その能力を称賛に値する実績で証明している。
² BarclayHedge Pollによると、ヘッジファンド回答者の56%が投資プロセスにAIまたは機械学習を導入していると回答した。さらに、JPMorgan Chase Surveyでは、調査対象となった835の機関投資家およびプロのトレーダーの50%以上が、AI技術が今後3年間で取引に最も大きな影響を与えると信じていることが判明した。
³ 例えば、SECはAI技術の適用に関する新たな規則を提案した(SEC, 2023)。加えて、欧州証券市場監督局(ESMA)はEU証券市場におけるAI利用に関する報告書を公表した(Bagattini, Benetti and Guagliano, 2023)。
⁴ 学習バイアスは、アルゴリズムバイアスまたはAIバイアスとも呼ばれ、学習プロセスにおける誤った仮定により、アルゴリズムが系統的に偏った結果を生成する際に現れる。
⁵ 製品市場競争の文脈では、ハブ・アンド・スポーク型共謀は、サプライチェーンの一段階にある企業(買い手や供給業者など)が「車輪のハブ」のように機能するカルテルを説明するために使用される比喩である。サプライチェーンの上流または下流の垂直的合意が「スポーク」として機能する。複数の競合他社が、共通のサービスプロバイダー(ハブとして機能する)によって提供される同じAI価格設定アルゴリズムを使用する場合、反競争的な影響が生じる可能性がある(例:Johnson and Sokol, 2021)。
関連研究
過去数十年にわたり、繰り返しゲームにおける複数のQ学習エージェント間の自律的な協力というテーマは、人工知能およびコンピューターサイエンスコミュニティの研究者から大きな注目を集めてきました(例:Sandholm and Crites, 1996; Tesauro and Kephart, 2002)。
さまざまな市場での価格決定におけるAI技術の広範な採用を考慮すると、Waltman and Kaymak (2008) は、Q学習ファームが、完全なカルテルは通常達成できないものの、同質製品の繰り返しクールノー複占ゲームにおいて競争を超える利益を獲得することを学習することを示しています。Klein (2021) もまた、同質製品を販売する企業が、競争を超える利益を維持するために価格調整を交互に行う文脈で、アルゴリズムが採用する戦略を検証しています。
最近の特筆すべき貢献として、Calvano et al. (2020) は、差別化された製品のロジットモデルにおけるAIアルゴリズムによる共謀を研究し、競争を超える利益の存在だけでなく、アルゴリズムがグリムトリガー戦略を通じて共謀的な結果を維持する方法を正確に特定しました。
これらをさらに発展させ、本論文はAI実験フレームワークを大幅に拡張し、完全情報と静的な需要曲線のシナリオから、非対称情報と戦略的に決定される需要スキームが組み込まれたシナリオへと移行します。私たちは、価格トリガー戦略を通じて、または学習バイアスと均質化を通じて発生するかどうかにかかわらず、多様な市場環境におけるさまざまな種類のAIアルゴリズム共謀を特徴づけています。
AIアルゴリズム共謀に関するシミュレーションベースの研究に触発され、実証研究も登場しており、製品価格設定におけるAIアルゴリズムの使用が共謀につながり、競争を超える価格の高騰をもたらすことを示しています(例:Assad et al., 2023)。
加えて、最近の研究では、アルゴリズムの共謀能力を阻害し、競争価格の維持を確実にするための政策介入に焦点を当て始めています。特に、シミュレーションベースの研究に基づき、Johnson, Rhodes and Wildenbeest (2023) は、プラットフォーム設計が消費者とプラットフォームに利益をもたらす可能性があるが、これらの利益を達成するには、過去の行動に条件をつけ、売り手を非中立的に扱う政策が必要となる可能性があることを示しています。Harrington (2019) は、共謀の定義を取り巻く重要な政策問題について深く掘り下げています。Harrington (2019) は、共謀が共謀者間の明示的な合意を必ずしも伴うべきか、あるいは報酬と罰則の仕組みによって維持される高騰した価格の維持としてより適切に定義されるべきか、といった政策問題について議論を提供しています。
本論文の貢献
本論文は、AIパワードトレーディング戦略の広範な採用が資本市場にどのように影響するかを研究する最初期の研究の一つです。Colliard, Foucault and Lovo (2022) の研究は、Q学習アルゴリズムの相互作用を通じて資本市場におけるアルゴリズム共謀の出現を探求している点で、私たちの研究と密接に関連しています。
しかし、彼らの研究と私たちの論文では、焦点に顕著な違いがあります。具体的には、Colliard, Foucault and Lovo (2022) はAIパワードの寡占的マーケットメイカーに焦点を当てているのに対し、私たちの研究は、完全競争的マーケットメイカーに直面するAIパワードの寡占的情報トレーダーに焦点を当てています。
Colliard, Foucault and Lovo (2022) は、AIパワードマーケットメイカーがアルゴリズム共謀を通じて維持される市場支配力を活用して、逆選抜を戦略的に軽減する方法を深く掘り下げています。彼らの研究は、マーケットメイカーが私的情報によって引き起こされる課題に対処し、寡占環境内で結果を最適化するために採用する戦略に光を当てています。
対照的に、本論文は、AIパワードの情報トレーダーが自身の私的情報をどのように利用し、アルゴリズム共謀を通じてその市場支配力を行使するかを検証することで、前述の研究を補完します。私たちは、完全競争的マーケットメイカーが存在する状況下での、情報トレーダー間の共謀のダイナミクスと影響を調査します。情報トレーダーの視点に焦点を当てることで、私たちは、これらの参加者が自身の私的情報を活用し、共謀を通じて利益を最大化するために採用する戦略に関する追加的な洞察を提供しています。




免責事項
記事は、一般的な情報提供のみを目的としてのみ作成したものであり、投資家に対する有価証券の売買の推奨や勧誘を目的としたものではありません。また、記事は信頼できると判断した資料およびデータ等により作成しておりますが、その正確性および完全性について保証するものではありません。また、将来の投資成果や市場環境も保証されません。最終的な投資決定は、投資家ご自身の判断でなされますようお願いします。