AIニュースの動画「メタの新LLaMa V2オープンソースがOpenAI+マイクロソフトを脅かす(3つの機能発表)」を要約。詳細は元動画をご覧ください
メタの新LaMa V2オープンソースがOpenAI+マイクロソフトを脅かす(3つの機能発表)
要約
この動画ではまず、メタ(旧Facebook)が開発した新しいAIモデル、LLaMa V2について述べています。LLaMa V2は、言語、コード、画像の生成が可能なマルチモーダルAIで、GPT-4、Microsoft、Googleを上回る性能を持つとされています。また、オープンソースとして提供されることで、AI開発者がGPT-4などのプロプライエタリなAIから移行する可能性を示唆しています。
LLaMa V2は、商用ライセンスを保持しつつ、ビジネスやユーザーに役立つ形で提供されます。これにより、オープンソースコミュニティの力を活用しつつ、商用利益も確保するという二重の利点を持つモデルが形成されます。
また、メタはLLaMa V2をInstagramのチャットボットやコンテンツモデレーション、翻訳ツールなどの既存サービスに組み込むことを検討しています。これにより、メタはAIの応用範囲を広げるとともに、最新のオープンソースの成果をサービスに統合することで研究開発を進めることができます。
さらにこの動画では、Stability AIが開発したStable Doodleというツールについても紹介されています。このツールは、シンプルなドローイングを高解像度のAI画像に変換することができます。ユーザーはマウスでドローイングを作成するだけでなく、ドローイングがどのように描かれるべきかを説明することもできます。また、14種類の異なるスタイルを選択することができます。
Stable Doodleは、教育やクリエイティブデザインなどの様々な業界を革新する可能性があるとStability AIは信じています。また、このツールは、テキストプロンプトを超えた入力によってAI画像の結果を影響させるという成長するトレンドの一部であり、Adobeが最近、3Dオブジェクトの配置がAI画像をさらにカスタマイズする方法を示したことを例に挙げています。
トランスクリプトの日本語訳
(00:00)かつてフェイスブックとして知られていたテック界の巨人メタは、LLaMa V2と呼ばれる全く新しいAIモデルでAI業界を破壊しようとしている。
(00:22) しかし、このオープンソースのAIは、GPT 4や他のクローズドソースのライバルにどれほどの脅威をもたらすのだろうか?意外なことに、メタバースを放棄した後、メタは代わりにオープンソースのAI革命に参加することに注力している。 そして、GPT 4がオープンAIプラスマイクロソフトに支えられ、印象的な市場シェアを持つ一方で、Metaの最初の大規模言語モデルLLama V1は、すでに他のオープンソースプロジェクトに波紋を広げている。
(00:49)しかし現状では、LLama V1は研究用ライセンスの下で運用されており、商用アプリケーションに展開することはできない。 LLaMa V2の登場はそれを変えるかもしれない。さらにMeta社は、おそらくLLaMa V2と思われる新しいAIモデルの登場を示唆しており、Meta社はこのモデルを自社の様々なサービスに活用し、外部の関係者に対応することを目指している。
(01:10)さらに、この技術大手は重要なセールスポイントである強固な安全メカニズムを強調している。しかし、LLaMa V2は特に、競争の激しいAIの世界で際立っている。 最も注目すべきは、Metaの戦略的なプレーは、LLaMa V2が企業やユーザーにサービスを提供する一方で、Metaが商用ライセンスと権利を保持し、独自のデータによる微調整のような追加サービスを提供することを可能にする、AndroidのオペレーティングシステムにおけるGoogleの戦略と同様のオープンソースアプローチにある。
(01:40)このデュアル・アドバンテージ・モデルが、メタ社の躍進を後押ししている。 オープンソースコミュニティの総合力を活用する一方で、有利な商業的利益を保持する。では、これはAI業界にとって本当は何を意味するのだろうか?LLaMa V2の発表は、プロプライエタリなものに代わるオープンソースの商業的に実行可能な代替手段によって、GPT 4などを超えるオークションを求めるAI開発者の大移動に火をつける、変革の一歩となることを約束する。
(02:07)オープンソースがAIレースを支配するだろうというグーグル内部関係者の信念は、予期せぬライバルの登場によって検証の瀬戸際に立たされるかもしれない。実際、Metaの野心的な動きは、AIビジネスの力学を完全にかき乱す可能性がある。最近フランスで開催されたカンファレンスで、同社のAI責任者がこの潜在的なゲームチェンジャーをほのめかし、オープンソースプラットフォームがクローズドソースプラットフォームに匹敵し、その品質においてクローズドソースプラットフォームを凌駕する日も近いかもしれないことを示している。
(02:34)この予言が実現すれば、AIモデル市場におけるパワーバランスは、少数ではなく全員にシフトすることになる。しかし、このオープンソースAIイニシアチブはメタ社にとって戦略的な恩恵である一方で、同社はこれがオープンAIの優位性に挑戦するためのより大きな計画の一部であることを認めている。主な目的は、堅牢で強力なAIモデルを作ることにある。
(02:55)しかし、Meta社はLLaMa V2にどのような実用的なアプリケーションを想定しているのだろうか?Meta の LLaMa V2 のビジョンは、商用ライセンス計画だけにとどまらない。同社は、Instagramのチャットボットやコンテンツモデレーション、翻訳ツールといった既存のサービスにLLaMa V2を組み込むことを想定している。そうすることで、MetaはAIアプリケーションを多様化させるだけでなく、最新のオープンソースのブレークスルーを自社のサービスに統合することで、研究開発を推進する。
(03:24)LLaMaV2のマルチ・モデル機能の全詳細は、技術コミュニティーの期待との確執により、まだ伏せられたままだが、そのマルチモーダルAIアプローチの成功により、Maesetはオープンソース開発とプロプライエタリAIの相互作用を再定義することになるだろう。さらに、LLaMa V2がこの戦いに参入したことで、開発者、企業、そしてAI愛好家も同様に、LLaMa V2が既存の強豪とどのように肩を並べるかを見ようと躍起になっている。
(03:51)一方、Stable Doodle社のSDXLは、高解像度のAI画像の精密出力に革命を起こしている。AI業界ではすでに定評のあるStability AIは、同社のClipDrop AIプラットフォームにStable Doodleを導入したばかりだ。このツールは、シンプルな落書きを驚くような高解像度のAI画像に変換するように設計されている。
(04:18)この印象的な進歩は、日常的なアプリケーションにAIを統合するという現在のトレンドに沿ったものだが、Stable Doodleには、ユーザーがマウスを使って落書きを作成できるだけでなく、落書きが描写すべき内容を提供できるというユニークな機能がある。
(04:36) さらにこのツールは、フォトリアリズム、アナログ写真、折り紙、アニメ、ピクセルアートを含む14種類のスタイルを備えている。 しかし、Stable DoodleはStability AIの最新かつ最もパワフルなモデルをどのように活用しているのでしょうか?それを実現するのが、Stable Diffusion Excelです。 Stable Doodleの機能は、StabilityのSDXLの不特定バージョンをベースに構築されている。
(05:00) 現在ClipDropとDream Studioでしか入手できないSDXL 0.9を使用しているのかどうか、謎のまま作成された。初歩的な手描きスケッチを詳細な画像に変換するために、StabilityはSDXLをTencentのオープンソーステキスト画像変換アダプターと統合しています。テキストから画像への変換は、スケッチやセグメンテーションマップやポーズなどの追加入力条件を提供することで、SDXLのような既存の大規模拡散モデルに別の次元を追加します。
(05:30)これは、すでに安定した拡散において人気のある機能であるControlNetと類似している。Text to ImageとControlNetの利点は、その非侵入的な性質にある。これらは、事前に訓練されたモデルの本来の生成能力に影響を与え、同じ基盤に基づいた異なるモデルに適用することができる。
(05:47) Stable Doodleツールは、ClipDropのウェブサイトやAndroidとiOS用のスマートフォンアプリから自由にアクセスできる。ただし、透かしなしの画像をダウンロードするには、プロ会員になる必要がある。アマチュアとプロフェッショナルの両方をターゲットにしたこのツールは、教育やクリエイティブデザインなど様々な業界に革命を起こす可能性があるとstabilityは考えている。
(06:09) Stable Doodleは、テキストプロンプト以外の入力でAI画像の結果に影響を与えるという、増加しつつあるトレンドの一部である。アドビは最近、3Dオブジェクトの配置によってAI画像をさらにカスタマイズできることを実証した。簡単なスケッチを画像生成プロセスに組み込むというコンセプトも新しいものではない。Deepmindは2018年の時点で同様のアプローチを実験していた。
(06:32)しかし、解像度と詳細度という点では、Stable Doodlesの結果は以前の試みを凌駕している。Stable Doodlesの機能の全容が明らかになるにつれ、この斬新なツールがAI業界にその名を刻む準備が整っていることは明らかだ。SDXLとテキストから画像への変換、そしてユーザーの創造的な入力の組み合わせは、シンプルな落書きを印象的なAI画像に変換するための強力な三要素を作り出します。
(06:58) 「Stable Doodle」で使用されているSDXLバージョンの詳細はまだ明かされていないが、この謎めいた要素によって、このツールに対する期待がさらに高まっている。初歩的なスケッチと高解像度画像のギャップを埋めることで、Stable DoodleはAIで達成できることの限界を押し広げる。私たちが未来に目を向けるとき、Stable Doodleのようなツールは、創造的知性の収束を強調する。
(07:21)MetaのようなAIの巨人が言語モデルのイノベーションを推進する一方で、Stability AIのような企業は、利用しやすいモデルでAIの展望を再形成し、AIがテキストや画像を超えて動画やその他に拡張する時代への道を切り開いている。イラストレーターが、大まかな絵コンテを映画やゲームのアニメーションに簡単に変換できるようになることを想像してみてほしい。
(07:44)通信社はこのツールを利用して、ストーリーのためのカスタムビジュアルを作成し、視聴者のエンゲージメントを高めることができるだろう。マーケティング担当者は、広告キャンペーン用のユニークなイメージを素早く作成し、消費者とのパーソナライズされたつながりを育むことができるだろう。独立系コンテンツクリエーターは、Stable Doodleを活用して、ブログ、ソーシャルメディア投稿、ウェブコミックを充実させることができ、コンテンツ制作において競争力を得ることができる。