AIにとってこの一年は、ニッチからメインストリームまでの意向がかつてないほどのスピードで進み、大きな話題となった年だった。
しかし2024年は、AIの能力と限界を人々が認識し、誇大広告が現実のものとなる年になるだろう。
以下は私たちが考える2024年のAIの展開である。
(以下は、TechCrunchのAIに関する記事を翻訳編集したものであり、元の記事・内容について当社が独自に制作・発信しているものではございません。)
OpenAIが製品会社になる
2023年11月の指導者の入れ替えの後、OpenAIは変わることになる。外見上の変化かもしれませんが、サム・アルトマンが完全に指揮を執ることによる連鎖反応はあらゆるレベルで感じられるだろう。
その表れの1つとして期待されているのが、「出荷する」というマインドセットだ。
GPTストアは本来12月にローンチ予定でしたが、C-suiteの騒動により延期されている。
この「AIのためのアプリストア」は、AIのおもちゃやツールを手に入れるためのプラットフォームとして積極的にプッシュされ、Hugging Faceや他のオープンソースモデルは気にしていない。
彼らはAppleの優れたモデルを手本にし、それを頼りに銀行までたどり着くだろう。
2024年のOpenAIでは、以前の取締役会が示していた慎重さや学問的な抑制が後退し、市場と顧客に対する品のない欲望が台頭することが予想される。
他の主要なAIを取り巻く企業もこの傾向に従うだろう。
エージェント、生成動画、生成音楽は古風なものからより実験的なものへ
2024年には、エージェントベースのモデルや生成型マルチメディアなど、AIモデルの一部のニッチな応用が「まあまあ」のステータスを超えて成長するだろう。
もしAIが要約やリストの作成以上のことをしようとすれば、依然としてスプレッドシートやチケット販売インターフェース、交通アプリなどにアクセスする必要がある。
2023年には、この「エージェント」アプローチの暫定的な試みがいくつか見られたが、実際に普及したものはなかった。
しかし、エージェント・ベースのモデルは、昨年よりも少しは説得力を増し、保険金請求のような面倒なプロセスで、いくつかのユースケースが現れるだろう。
動画や音楽に関しても、その欠点がそれほど目立たない適所を見つけるだろう。
熟練したクリエイターの手にかかれば、写実性の不足は問題にならない。
同様に、生成音楽モデルはゲームなどのいくつかの大作に採用される可能性が高く、そこでもまたプロのミュージシャンがツールを活用して、終わりのないサウンドトラックを作ることができるだろう。
モノリシックな大規模言語モデル(LLM)の限界が明らかに
これまでLLMの能力については楽観的な見方が多かった。
実際、その能力は我々が予想していたものよりも高いことが証明されており、計算能力が向上するにつれてその能力も高まってきた。
しかし、2024年には何かが起こるだろう。
この分野の研究は常に進化しており、それが具体的にどこで変化するのかを予測することは不可能である。
一件魔法のように見えるLLMの飛びぬけた能力は、2024年にはより詳細に研究され理解されるようになり、大きな数値の乗算ができないなどの制約がより理解されるようになるだろう。
それと並行して、パラメーターの数による収穫の減少が見られ始め、5,000億パラメーターのモデルを訓練した方が技術的には良い結果が得られるかもしれないが、そのために必要な計算量は、より効率的に配置できることが証明されるようになるだろう。
単一のモノリシックなモデルは扱いにくく高価だが、専門的な組み合わせ(より小さく、より具体的で、おそらく多様なモデル)は、断片的なアップデートがはるかに容易でありながら、ほぼ同等の効果を証明するかもしれない。
マーケティングと現実の出会い
2023年に築かれた誇大広告は、企業がその後に追随するのが非常に難しいものになるだろう。
企業が遅れを取らないために採用した機械学習システムのマーケティング上の主張は、四半期ごと、あるいは1年ごとに見直されることになる。
コストとリスクを正当化するだけのメリットが得られないため、AIツールからかなりの顧客が撤退することが予想される。
このスペクトルの一番端では、我々は、彼らの主張を裏付けることができなかったAIサービスプロバイダ対する訴訟や規制措置が見られる可能性もある。
能力は引き続き成長し進化するが、2023年の製品がすべて生き残ることはないだろうし、波に乗り遅れた企業が倒れたり消費されたりすることで、統合が進むだろう。
Appleの参入
Appleには、他社の失敗を待ち、観察し、学んだ後、他社を凌駕する洗練された手法で参入するという、確立されたパターンがある。
AI分野でもAppleがこれを行うのは、市場が競合他社によって取り込まれる可能性だけでなく、テクノロジーが彼らの改善に適しているためだ。
私は、ユーザー自身のデータの実用的な応用に焦点を当てたAIを期待したい。ユーザーの生活においてますます中心的な位置を占めるようになったAppleを利用して、同社が把握している多くのシグナルとエコシステムを統合するのだ。
また、問題のあるプロンプトや危険なプロンプトを処理する巧妙でエレガントな方法もあるだろうし、(主にユーザーの画像を処理するために)マルチモーダルな理解力を持つことはほぼ間違いないだろうが、メディア生成は完全に省略されるだろうと想像している。
狭い範囲で調整された、しかし印象的なエージェント機能も期待したい。
例えば、「Siri、ダウンタウンの寿司屋で7時に4人用のテーブルを予約し、車を手配して」といったような。
予想が難しいのは、それを改良されたSiriとして請求するか、それとも全く新しいサービス「Apple AI」として、ユーザーが自分で選べる名前で提供するかどうかだ。
しかし、すでに数百万人が10秒に1回「Siri」と言っているのだから、その勢いを維持することを選ぶ可能性が高い。
法的なケースの構築と崩壊
2023年にはかなりの数の訴訟が提起されたが、成功はおろか、実質的な動きを見たものはほとんどなかった。
AI産業における著作権やその他の不手際をめぐる訴訟の大半はまだ審理中だ。
2024年には、企業がトレーニングデータや手法といった重要な情報を封じ込め、著作権で保護された何千冊もの書籍の使用といった申し立てを法廷で立証することを難しくしているため、多くの訴訟が道半ばで頓挫することになるだろう。
しかし、これは始まりに過ぎず、これらの訴訟の多くは基本的に原則に基づいて起こされたものである。
成功はしないかもしれないが、証言や証拠開示の過程で、企業が特定の情報が明るみに出るよりは和解した方がましだと考えるほど、プロセスにひびが入るかもしれない。
2024年には、不当解雇、雇用や融資における偏見など、AIの誤用や濫用に関連する訴訟や、AIが熟考されることなく実用化されているその他の分野でも、新たな訴訟が起こるだろう。
しかし、濫用の顕著な例に対しては罰せられることもあるだろうが、それに特化した関連法がないため、必然的に行き当たりばったりでしか裁判にかけられないことになる。その点では…
早期採用者は新しいルールに立ち向かう
EUのAI法のような大きな動きは、業界の仕組みを変える可能性があるが、その影響が実際に現れるまでには時間がかかる。
これは、企業が一晩で新しいルールに適応する必要がないように設計されたものだが、同時に、先手を打って自発的に変化を起こそうとする企業以外では、こうした大きな法律の効果をしばらくの間見ることができないということでもある。
多くの場面で「私たちはプロセスを開始しています…」という話が増えるだろう。(また、法律のさまざまな部分に異議を唱える静かな訴訟がいくつか起こることも予想される)。
何十億ドルもの資金がテクノロジーに投入され、それに見合った投資(規模は小さいが、それでも相当なものだ)がツールやプロセスが国際基準や地域基準に適合するように行われるため、AIコンプライアンス産業が新たに繁栄することが予想される。
米国での連邦政府による実質的な規制を期待している人にとっては残念なことだが、2024年はその動きを期待する年ではない。
AIの年になり、誰もが新しい法律を求めるだろうが、米国政府も有権者も2024年の選挙で起こる混乱で忙しくなるだろう。
2024年の選挙は「trash fire(ごみの火事)」と表現され、これが混乱を招きAIが状況を悪化させる可能性がある
2024年の大統領選挙がどうなるかは、今のところ誰にもわからない。
あまりにも多くのことが宙に浮きすぎているため本当の予測はできないが、前回と同様、影響力を行使する者たちは都合のいい形であれAIを含め、針を動かすためにあらゆる手段を使うだろう。
例えば、botアカウントや偽のブログが、年中無休でナンセンスな情報を発信することが予想される。
テキストと画像のジェネレーターをフルタイムで使っているわずかな数の人々が、完全に捏造された画像やニュースを使ったソーシャルメディアやブログの投稿を何百も生み出すこともできる。
“ゾーンの洪水 “は常に効果的な戦術であったが、今ではAIが労働力を増幅させ、より大量でありながらターゲットを絞ったキャンペーンを可能にする。
物語を混乱させ、人々が見たり読んだりするものすべてに不信感を抱くような状況を作り出すために、偽陽性と偽陰性の両方が期待される。
混乱を好む政治家にとっては好都合だ。
有権者名簿の粛清、開票数への異議申し立て、その他既存のプロセスを抑圧したり妨害したりする努力を裏付けるために、各組織は「AIを駆使した」分析を売り物にするだろう。
生成された動画や音声もこの争いに加わるだろう。
どちらも完璧ではないが、若干のぼかしを加えれば十分に信憑性を持たせることができる。
リップは完璧である必要はなく、暗い部屋での携帯電話のズームインキャプチャや、プライベートイベントでのホットマイクなどとして提示されるからだ。
そうなれば、”私と彼、どちらを信じるか?”という問題になる。一部の人々はそれだけで十分なのだ。
生成されたコンテンツがこのような形で利用されるのを阻止するために、いくつかの薄っぺらな試みが行われるだろう。
しかし、このような投稿はMetaやGoogleのような企業ではすぐに削除することはできないし、Xがこのようなコンテンツを効果的に監視し、削除することができる(あるいはするつもりである)という考えはありえない。
嫌な時代になりそうだ!
出所:https://techcrunch.com/2023/12/19/8-predictions-for-ai-in-2024/