オープンソースの生成AIで注意すべき10のこと

最近では、誰もがAIモデルを作成できるようになった。トレーニングデータやプログラミングスキルがなくても、お気に入りのオープンソースモデルを入手し、微調整を加えて、新しい名前でリリースすることができる。 4月に発表されたスタンフォード大学のAIインデックスレポートによると、2023年には149の基盤モデルがリリースされ、その3分の2はオープンソースだった。そして、そのバリエーションの数は途方もない。Hugging Faceは現在、テキスト生成だけで8万以上のLLMを追跡しており、幸いにも、さまざまなベンチマークでスコアを基準にモデルを素早く並べ替えることができるリーダーボードがある。そして、これらのモデルは、大手企業の商用モデルには及ばないものの、急速に改善が進んでいる。 EYアメリカズでジェネレーティブAIをリードするデビッド・グアレラ氏によると、オープンソースのジェネレーティブAIを検討する際は、リーダーボードが参考になる。特にHugging Faceはベンチマークの面で優れた仕事をしているという。 「しかし、これらのモデルを実際に試してみる価値を過小評価してはならない」と彼は言う。「オープンソースなので、簡単に試したり入れ替えたりできるからだ。そして、オープンソースモデルとクローズドな商用代替モデルとの性能差は縮まりつつある」と彼は付け加える。 「オープンソースは素晴らしい」と、Uber Freight のエンジニアリング部門責任者、Val Marchevsky 氏は付け加える。 「私はオープンソースに非常に価値があると感じている」と。 オープンソースモデルは、プロプライエタリモデルに性能で追いついているだけでなく、クローズドソースには真似できない透明性を提供するものもあると同氏は言う。 「一部のオープンソースモデルでは、推論に何が使われ、何が使われていないかがわかる」と同氏は付け加える。 「監査性は、幻覚を防ぐために重要である」 もちろん、価格面でのメリットもある。 「もし、たまたま容量に余裕のあるデータセンターをお持ちなら、なぜ他者に支払う必要があるのか? 」と彼は言う。 企業はすでにオープンソースコードの使用に精通している。2月に発表されたシノプシスのオープンソースセキュリティおよびリスク分析によると、すべての商用コードベースの96%にオープンソースコンポーネントが含まれている。 こうした経験から、企業は、適切なライセンスを取得したコードを使用するために何をすべきか、脆弱性を確認する方法、そしてすべてを常に最新の状態に保つ方法を知っているはずだ。しかし、これらのルールやベストプラクティスの中には、企業が見落としがちな微妙なニュアンスがあるものもある。以下は、その主なものである。 1. 奇妙な新しいライセンス条項 さまざまなオープンソースライセンスの種類は、その概要だけでも複雑である。そのプロジェクトは商業利用に安全なのか、それとも非商業的な実装にのみ安全なのか? 改変して配布することは可能か? プロプライエタリなコードベースに安全に組み込むことは可能か? さて、生成AIが登場したことで、いくつかの新たな問題が生じている。まず、非常に緩やかな定義のもとでのみオープンソースとなる、新しいライセンスの種類がある。 例えば、Llama ライセンスがある。 Llama モデルのファミリーは、オープンソースの LLM の中でも最高のものの一つだが、Meta はこれを「モデルへのオープンアクセスと、潜在的な誤用に対処するための責任と保護措置のバランスがとれたカスタムメイドの商用ライセンス」と公式に説明している。 企業は、モデルを商業的に使用し、開発者がベースとなる Llama モデルに追加作業を加えて作成・配布することは認められているが、Llama 派生品でない限り、Llama の成果物を使用して他の LLM を改善することは認められていない。また、企業またはその関連会社での月間ユーザー数が 700 人を超える場合、Meta が許可するかどうかは不明だが、ライセンスを申請しなければならない。Lama 3を使用する場合は、「Built with Llama 3」という文言を目立つ場所に表示しなければならない。 同様に、Appleは「Apple Sample Code License」のもとでOpenELMをリリースした。これは、この機会のために考案されたもので、著作権許可のみをカバーし、特許権は除外されている。 AppleもMetaも、一般的に受け入れられているオープンソースライセンスは使用していないが、コード自体はオープンである。Appleは実際にコードだけでなく、モデルの重み、トレーニングデータセット、トレーニングログ、事前トレーニング構成も公開している。これが、オープンソースライセンスのもう1つの側面につながる。従来のオープンソースソフトウェアは、まさにコードそのものである。オープンソースであるということは、それが何をしているのか、潜在的な問題や脆弱性がないかどうかを確認できるということだ。 しかし、生成AIは単なるコードではない。トレーニングデータ、モデルウェイト、微調整なども含まれる。これらのすべてが、モデルの仕組みを理解し、潜在的な偏りを特定するために不可欠である。例えば、地球は平らであるという陰謀論のアーカイブでトレーニングされたモデルは、科学的な質問に対する回答が苦手になるだろうし、北朝鮮のハッカーによって微調整されたモデルは、マルウェアを正しく識別できない可能性がある。では、オープンソースのLLMは、これらの情報をすべて公開しているのだろうか?それはモデルによって、あるいはモデルリリースによって異なる。なぜなら、標準がないからだ。 「コードが利用可能になることもあるが、微調整を行わないと、同等のパフォーマンスを得るために多額の費用がかかる可能性がある」と、カーネギーメロン大学のAI教授で、PwCの元グローバルAIリーダーであるアナンド・ラオ氏は言う。 2.…

The rising software supply chain threat: Mounting a unified defense

Malicious actors have been pressing their advantage against vulnerable software supply chains with exponentially increasing attacks. Enterprises have been hampered in fighting back by lack of internal consensus on their security capabilities and practices. Recent survey findings uncovered multiple areas of disconnect between senior executives/managers (“executives”) and hands-on staff (“doers”). Executives tended to have a…

フェロビアル、AIを変革の中心に据える

イノベーションを加速させ、デジタルインフラストラクチャとサービスを変革することを目的に、フェロビアルはデジタル戦略の研究と実験が、例えば、新たな収入源を提供し、企業運営を改善するためのミーティングポイントとして機能する、デジタルハブを構築しました。

5年以上前の構築以来、デジタルハブには、IoT、ビッグデータ、AI、ドローン、3Dプリント、カスタマーエクスペリエンスの進歩といった、イノベーション、テクノロジー、トレンドのエキスパートがチームに参画し、他の事業部門と連携して新たな機会を特定し、実行しています。明確な階層構造はありませんが、このハブは横断的なコラボレーションモデルに基づいています。このモデルでは、グループが作成され、あらゆる分野の従業員が外部の専門家とともに特定のプロジェクトに取り組みます。

主な戦略的横断分野の一つはAIです。フェロビアルのAIセンター・オブ・エクセレンス(AI CoE)責任者であるルイス・カルロス・プリエト・フェルナンデス氏によれば、その価値は同社がすべての事業部門と行ってきた作業によって実証されています。「すべての事業部門に、プロセスを自動化、効率化したり、ビジネスに競争上の優位性をもたらすサービスを提供したりするAIベースのサービスがあります」と同氏は説明します。

これを念頭に置き、AI CoEは世界レベルで2つの明確な方針に沿って行動しています。一つ目は、デジタルハブ・チームの他のメンバーとともにデジタルソリューションを創造する事業部門のためのAIモデルとプロジェクトの開発です。もう一つは、フェロビアルがグローバルな企業であることから、すべての部門と継続的に連絡を取り合い、AIのナレッジハブとして機能させることです。「これにより、すでに取り組んでいるアイデアやソリューションを提示することができ、概念実証やプロジェクトの重複を避けることができます」と同氏は付け加えます。

AIを軌道に乗せる

数年にわたってAIの革新に取り組んできたフェロビアルは、AIの恩恵を受けたプロジェクトやサービスの例を数多く挙げることができます。「いわゆる定番のAIを例としては、除草剤列車プロジェクトがあります。このプロジェクトでは、時速50キロ未満にならないスペイン全土の列車にフロントカメラを設置しています。「コンピュータービジョンのモデルと組み合わせることで、レールとレールの間に植物があることを検出し、7両後方まで除草剤を噴射することができます」とプリエト氏は説明します。このようなことができるようになることで、経済的な効果と同様に生態系への効果ももたらされます。経済的にはグリホサート(除草剤)のコストを80%以上削減することができ、生態系への効果としては、必要な場合にのみ灌漑を行えばよくなります。

さらに、記録的な速さで情報を入手する能力がすべての事業に提供されるため、同社は2022年12月より生成AIとLLM、特にAzure OpenAIに取り組んでいます。そのため、すでに本番環境にある複数のフォーマットで膨大な量のデータを分析するプロジェクトは、現在ではかなり効率的でコスト効率の高いものとなっています。

「プロセスを加速し、同僚にとって最も価値の高いタスクに優先順位をつけるソリューションをビジネスに提供できることは、非常に明確なメリットであり、私たちの仕事の価値を高めることができます」とプリエト氏は言います。

段階的なAIの進歩

このように先進的な技術が導入されているにもかかわらず、プリエト氏はまだまだやるべきことが多くあると考えています。その結果、フェロビアルはスペインの産業界でAIを推進する団体IndesIAの設立パートナーとなりました。「AIの使いやすさとAIによって得られる価値が信じられないほど素晴らしいことが経営幹部レベルに示されたのは事実です。しかし、当社はデータサイエンティストが誤解され、事業が他の分野に投資することを優先するような資金を提供された場合にのみ価値を付加できるという状況から出発しました。今では、もはやそうではないことが明らかになりつつあり、当社は、これらの投資に対する顕著なコスト削減と前向きなROI(投資収益率)を実証することができます」と同氏は述べます。

すべての企業にAIチームがあるわけではないことを考えるとまだ道のりは長いですが、AIサービスの利用はどんどん簡単で手頃になってきています。「IndesIAのようなイニシアチブにより、業界はこうしたサービスを簡単な方法で利用できるようになります」とプリエト氏は付け加えます。

DX(デジタルトランスフォーメーション)のAI基盤

DXは、あらゆる分野の企業にとって、より大きな価値をもたらし、競争力を維持するために最も重要な触媒の一つであり、AIは重要な役割を果たしているとプリエト氏は語ります。

除草剤列車プロジェクトや送電線検査へのコンピュータービジョンの活用のほかにも、フェロビアルではAI CoEから開発された多くのAIアプリケーションがあり、全事業に影響を与えています。しかし、プライバシー、セキュリティ、倫理、透明性、説明責任に関しては、AIはいくつかの課題やリスクも抱えています。「この技術が適切かつ安全に使用され、社会にとって有益であることを保証するためには、規制が必要です。もちろん、規制は適切で、柔軟で、適応性があり、信頼、革新、競争力を促進するものでなければなりません」とプリエト氏は述べています。

フェロビアルの働き方を変革して価値を創造するために、AIだけでなく、他のテクノロジーも検討されています。「例えば、クラウドコンピューティングを使用して、スケーラブルで効率的な方法でデータを保存・処理し、IoTを使用して、高速道路、空港、現場オペレーションのインフラストラクチャのモニタリングと管理を行っています。当社では、拡張現実や仮想現実を使って作業員のトレーニングや支援を行ったり、ビッグデータを使って大量の情報の分析と可視化を行ったり、機械学習を使って作業を自動化・最適化したり、ディープラーニングを使って画像やテキスト、音声などのデータから知識を抽出したりもしています」と同氏は説明します。

AIがもたらす確実な未来

AIやその他の革新的テクノロジーによって、ビジネスの状況は激変し続けています。「より多くのプロセスやタスクがAIを使用して自動化、最適化、パーソナライズされるようになりました。これはつまり、生産性、効率性、顧客満足度、従業員満足度の向上を意味します」とプリエト氏は語ります。さらに、AIはイノベーションを加速させ、新しい製品やサービスの創造を促進し、市場や社会の変化への適応をより効率的にします。特にフェロビアルでは、AIがDXの鍵を握っています。「当社ではこれをはっきりと確認できます。なぜなら、AIを使用することで、データから価値を引き出し、意思決定を改善し、知識を生み出すことができるからです」と同氏は言います。


Read More from This Article: フェロビアル、AIを変革の中心に据える
Source: News