AI(人工知能)と言うと、昨年世界的に大きな話題になったOpenAI 社が公開したChatGPTを思い浮かべる方も多いと思います。自然な会話形式で精度の高い回答が得られ、文章の要約や議事録の作成など、いままでとはレベルの違うアウトプットを手軽に得ることができるようになりました。業務で使用している方も増えているのではないでしょうか。
ますます関心が高まるAIに対して、シャープは独自のエッジAI技術「CE-LLM(Communication Edge-LLM)」を中心にAI開発を進めており、昨年11月に開催した初の単独技術展示イベント「SHARP Tech-Day」で、「CE-LLM」搭載のAIパートナーやAIアバターを展示(AIアバターは世界最大級のテクノロジー見本市「CES 2024」にも展示)し、スムーズに自然な会話ができるAI技術として注目を集めました。
*「CE-LLM」はシャープの商標登録です。
今回は、「CE-LLM」でどんな暮らしを実現できるのか、どのような技術なのか、開発担当の後藤に聞きました。
― エッジAI技術「CE-LLM」を使うとどんなことができるのでしょうか?
「CE-LLM」が搭載された端末に質問すると、会話中の間合いが低減され、スムーズで高速、自然な会話で回答してくれます。さらに問題解決のサポートまで対応可能です。
「SHARP Tech-Day」で展示したAIパートナーやAIアバターを例に具体的に説明します。
AIパートナーは、ウェアラブルネックスピーカー「サウンドパートナー」にCE-LLMを搭載したものです。
家族のスケジュールをあらかじめ入力しておき、「週末のレストランを予約したいので家族みんなの予定を教えて」とサウンドパートナーに話しかけると、「家族みんなが空いているのはこの時間です」などと速やかに回答してくれます。そうした会話を通じて、スケジュール調整ができるほか、スマホなどとの連携によりレストランの予約もサポートします。
ほかにも、献立を相談すると、旬の野菜を使ったメニューを提案した上で、水なし自動調理鍋「ヘルシオ ホットクック」にそのメニューをダウンロードするなど、家電製品のコントロールが可能です。
また、買い物相談をすると、会話のやりとりの後に、PCやスマホ、タブレットなどと連携し、おすすめ製品を扱うECサイトへ誘導するといったことも可能です。
このように、会話を軸にハンズフリーで様々なサービスに対応が可能で、家電機器の使い方がわからない場合もAIを介して、短時間に解決できるようになります。
もう一方のAIアバターは、CG(Computer Graphics)モデルとシースルーディスプレイを組み合わせたものです。「サラ」と名付けたバーチャル説明員が、様々な質問に、音声や、身振り手振りの3D(立体)アニメーションで回答します。 「SHARP Tech-Day」や「CES2024」では、展示ブースの見どころをはじめ、イベントの案内係として活躍しました。
― 人に相談するように会話応答や問題解決のサポートまでできるんですね。エッジAI技術「CE-LLM」について説明して欲しいのですが、まず、“LLM”とはどういう意味ですか?
LLMとは大規模言語モデル(Large Language Models)の略で、大量のテキストデータを学習させ構築したAIのことであり、ユーザーの問いかけに対する回答文章などを生成します。有名なものにChatGPT、最近ではGoogle Geminiなどがあります。LLM自体はテキストを生成するものですが、拡張機能を入れると画像の生成も可能です。
― LLMの一つがChat GPTですか。“エッジAI”とは?
ChatGPT などはクラウド経由して利用するAIですが、“エッジAI”とはユーザーの手元にあるエッジデバイス(パソコンやスマホなどの端末)で動作するAIのことです。つまり、クラウド経由でなく、手元にあるエッジデバイスの中で動作します。ネットへのアクセスが不要なので、クラウドへの通信が必要なChatGPTなどに比べ、すばやく返答が可能、かつ個人情報漏洩のリスクがないといったセキュリティ面のメリットもあります。
― では、エッジAI技術「CE-LLM」とは?
簡単に言えば、ユーザーの質問内容が簡単か否かをAI判定し、簡単な内容に対しては、エッジデバイス内のローカルLLMで迅速に回答。難しい場合は、ChatGPTなどのクラウドAIに複雑な回答を任せる、ということを行っています。
このように、エッジAI技術「CE-LLM」とは、ユーザーからの問いかけに対し、ChatGPTなどのクラウドAIか、ローカルLLMのエッジAIいずれで処理するかを即時に判断、切り替えることで、最適かつスムーズで自然な会話のやりとりを提供する独自技術です。
クラウドAIはデータの量が多く精度が高い一方、先ほど話しましたように、応答速度とセキュリティの問題があります。対して、エッジAIは簡単な会話レベルなら即時応答が可能です。いまは、エッジAIだと1秒足らずで返事がくるのに対し、クラウド経由だと5~6秒かかる場合もあります。これではスムーズな会話ができないですよね。質問内容に応じ、クラウドかローカルのどちらかを使い分けて良いとこ取りしようというのがコンセプトで、それを瞬時に判断する技術がCE-LLMの中核です。
― エッジとクラウドを切り替えるというのは面白いですね。発想はどこから出てきたのですか?
実は、生物の脳の仕組みを参考にしています。脳には、大脳と大脳辺縁系の2つ部位があります。大脳は理性をつかさどる社会脳。大脳辺縁系は、情動や反射をつかさどる、生存に関係する本能の部分(=生存脳)です。人間はこれにより理性と本能を使い分けることで、命の危険のある時にはすばやく反射(行動)できますし、じっくり思考することもできます。大脳をクラウドAI、大脳辺縁系をエッジAIに置き換え、質問によって使い分ければ、高速かつスマートに対応できるのではと思ったんです。
― なぜ、「CE-LLM」の開発を進めようと思ったのですか?
AIを使ったサービスは色々と展開されていましたが、基本的にはクラウドAIの使用を前提としたものだったことに加え、エッジAIなら、シャープが得意とする家電製品を通じて、これまで世の中にない製品やサービスを提供できると考え、「CE-LLM」の開発を始めました。
このシャープ独自の「CE-LLM」をコアに、家電を含む家庭の様々な機器、様々なネットサービスを高度に組み合わせることで、「より使い勝手のよい、人に寄り添うAI」を実現したいと思っています。現在は、実用化に向けて開発を進めているところで、将来はPCやスマホのみならず、家電製品本体にも「CE-LLM」を搭載したいと考えています。
― 「SHARP Tech-Day」では、多くのメディアに紹介されるなど注目されましたが、イベントから得た気づきなどについて教えてください。
AIアバターは、展示内容に関する質問をされることを想定してセッティングしたのですが、「今日の天気は?」「今、何時ですか?」「ここはどこ?」など、想定していなかった質問をする方がおられ、上手く答えられなかったケースもありました。
LLMを使った会話は、ユーザーの質問をLLMに投げ、そこからフィードバックされた情報をユーザーに返答するものです。つまり、質問に対して確度が高そうな文言を選んでいるだけで、意味を詳細に解釈しているわけではありません。お客様がどんな立ち位置で質問しているのか、どういう形式の答えを求めているのかなど、お客様の持っている情報や知識などを踏まえ最適化していく必要があり、前提となる条件やキャラ付け、さらに人間らしい対応といった部分をさらに磨いていかねばなりません。「CES 2024」では、テレビAQUOSの知識に長けた説明員というキャラ付けをして臨んだのですが、ディナーの誘いをする方が多く、それも想定外でした(笑)。
― 今後の展開や個人的な想いなどあれば教えてください。
キャラ付けも課題ですが、何より展示した開発品はまだまだ大きな端末が必要で、実用化のためにはさらなる小型化が不可欠です。ソフト・ハード両面からコンパクトになるよう、チーム全体で開発を進め、 いち早く、本格的なサービスが展開できるように取り組んでいきます。
また、個人的には、将来、「CE-LLM」でリモコンをなくせるのでは、と思っています。「CE-LLM」を搭載したエアコンに「今日は暑いな」と話しかけると、エアコンを最適な温度で運転してくれる世界感です。家電製品のリモコンが不要になれば、見つからなくて探す手間も無くなりますし、リモコンがない分、使用部材も減り、資源の節約にもなるので、いいこと尽くめじゃないでしょうか。実現できるよう頑張りたいと思います。
― ありがとうございました。
AIとスムーズに会話できる未来はまだまだ先だと思っていましたが、人と話すように迅速に会話をアシストしてくれる、スマホ代わりのパートナーが、近い将来に実現できるのではと感じさせる取材でした。今後のシャープのAIにぜひご期待ください。
また、noteコンテンツ(https://note.com/sharp_engineer)で、「CE-LLM」などシャープ目線でのAIの開発状況や活用方法などをシャープのAI開発者が投稿していますので、こちらもぜひご覧ください。
(広報H)
<関連サイト>
■note: https://note.com/sharp_engineer
■SHARP Blog:
関連記事