Apple のインテリジェンスは YouTube コンテンツについて訓練されていないと Apple が語る
Appleは、他の大手ハイテク企業とともに自社の人工知能モデルをトレーニングするためにYouTubeの字幕を使用していたことが調査で明らかになったのを受け、木曜日、同社のAIトレーニングデータの使用に関する懸念に対処した。
今週初めに行われた
Wired
の調査では、人気コンテンツクリエイターによる 170,000 本以上のビデオが AI モデルのトレーニングに使用されるデータセットの一部であったと報告されました。 Apple は、
4 月に公開された
オープンソース OpenELM モデルの開発にこのデータセットを特に使用しました。
しかし、Apple は 9to5Mac に対し、OpenELM が同社の Apple Intelligence システムを含む AI や機械学習の機能を強化していないことを認めました。 Apple は、OpenELM がオープンソースの大規模言語モデルの開発を進めることを目的として、研究目的のみに作成されたことを明らかにしました。
AI コードを共有するコミュニティである Hugging Face Hub で OpenELM をリリースする際、Apple の研究者らは、これを「オープンな研究コミュニティに力を与え、豊かにする」ために設計された「最先端のオープン言語モデル」であると説明しました。このモデルは、Apple の Machine Learning Research Web サイト からも入手できます。 Apple は、OpenELM モデルの新しいバージョンを開発する計画はないと述べています。
同社は、OpenELM が Apple Intelligence に統合されていないため、「YouTube 字幕」データセットは商用 AI 機能を強化するために使用されていないことを強調しました。 Appleは、Apple Intelligenceモデルは「特定の機能を強化するために選択されたデータを含むライセンスされたデータと、当社のウェブクローラーによって収集された公開データ」に基づいてトレーニングされているという以前の声明を繰り返した。
Wired のレポートでは、Apple、Anthropic、NVIDIA などの企業が AI モデルのトレーニングに「YouTube 字幕」データセットをどのように使用したかについて詳しく説明されています。このデータセットは、非営利団体 EleutherAI によって編集された、「The Pile」として知られる大規模なコレクションの一部です。










