Googleがサードパーティデバイス上での音声ベースのAssistantを開始 – InfoQ Japan



Google Assistant SDKを使用すると、Google Assistantの音声機能をRaspberry Pi 3やLinux上で動作するカスタムデバイスに統合できると、Google AssistantのプロダクトマネージャであるChris Ramsdale氏が書いている。ただし、商用利用のライセンス条項はまだ明確ではない。

Google Assistant SDKは、Googleで最初に開発されたRPCフレームワークであるgRPCを使用してクロスプラットフォームのクライアントとサーバを生成し、C++、Java、Python、Go、Node.jsなどのさまざまな言語のAPIにバインドさせる。GoogleがgRPCを選択する理由は、双方向の音声ストリーミングに適していることにある。特にRaspberry Pi 3の場合、Googleは音声クエリを記録してGoogle Assistantの回答を再生できる、カスタマイズ可能なPythonのサンプルを提供している。サンプルは、依存関係をインストールできるどのプラットフォームでも使用できなければならない。

Google Assistant SDKを使用すると、開発者はデバイスとAssistantとの間のやりとりをカスタマイズできる。たとえば、ボタンを押すことによってアシスタントが反応したり、Assistantからのユーザリクエストの音声認識トランスクリプトを取得したりできる。デバイスを音声制御するためにカスタムコマンドを作ることも可能である。これは、IFTTTを使用するか、より高度なユースケースに対してはActions on Googleを使用することができる。IFTTTは無料のWebベースのサービスであり、これによって、エンドユーザはGmail、FacebookなどのWebサービスの変更によってトリガされるアプレットを作成し、電子メールを送信したり、Twitterへ投稿したりといった、別のWebサービスを使ったアクションを実行できる。Actions on Googleは、開発者がGoogle Assistantデバイスとする会話をカスタマイズできるAPIである。Actions on Googleは、Amazon Alexa SDKやAmazon Lexに似ている。Amazonと同じように、GoogleはActionsが一般利用できるようになる前にレビューする必要がある。

Google Assistant SDKは、特に開発者がハードウェアデバイスのプロトタイプを作成できるように、開発者プレビューとして提供される。Googleはライセンス条項を開示しておらず、商用アプリケーションに興味があるかどうか開発者に対して提案している。



こんな記事も読まれています



コメントを残す