nal_column_20161125_2199881_424

IBM Watson(ワトソン)の日本語API

IBMのコグニティブコンピューティングシステム「Watson」の「日本語API」について紹介します。

「ベトナムで、人工知能システムの開発を請け負います!」

概要

IBM「Watson」とは

「Watson」は質問応答/意思決定支援システムです。IBMが開発したもので、自然言語処理技術と機械学習技術を使用して、大規模非構造化データを分析し、洞察を明らかにするテクノロジープラットフォームです。自然言語で投げかけられた複雑な質問を解釈し根拠に基づいた回答を提案します。

IBMの説明によると、Watsonは保険/金融/医療/メディア/製造/営業支援など、36カ国/29の産業/400社で利用や取り組みが始まっています。

日本語版「Watson」

Watson日本語版は、2016年2月にリリースされました。

IBMのPaaS(Platform as a Service)である「Bluemix」上のAPI(Application Programming Interface)として提供されています。

日本語API

日本語のニュアンスを理解/処理できる主な「Watson日本語API」を6種類紹介します。

Natural Language Classifier(自然言語分類)

「Natural Language Classifier(自然言語分類)」は、テキストを分類する機能です。

開発者が用意した手本となるデータをもとに自動学習した「Classifier(分類器)」が、短文やフレーズを分類します。例えば、Twitterの投稿について「ニュースor意見」「仕事orプライベート」などへの分類を行なえます。ニューラルネットワークを基本とする深層学習(Deep Learning)技術を利用しています。

入力されたテキストの背後にある意図を解釈し、関連度合いを信頼度レベル付けして、分類した結果を戻します。

機械学習/統計アルゴリズムに関する予備知識がなくても、意図や意味を理解し、回答を見つけ出せるアプリケーションを開発できます。

Dialog(対話)

「Dialog(対話)」は、自然言語で利用者と対話するための機能です。

利用者とアプリケーションの間の会話の分岐を自動化します。「利用者からの質問への自動応答」「難しい作業のガイド」などをアプリケーションに組み込めます。利用者プロファイル情報を蓄積し、各利用者個別の状況に応じるガイドも可能です。

Retrieve and Rank(検索およびランク付け)

「Retrieve and Rank(検索およびランク付け)」は、「検索エンジン+優先度設定」機能です。

オープンソース検索エンジン「Apache Solr」を使用して文書から質問(単語)と関連がありそうな情報を抜き出します。その後、機械学習Rank機能により利用者の関心の高い回答を出せるように優先度を設定します。

開発者は、データをサービスにロードして、既知の結果に基いて機械学習モデルを訓練します。訓練により改善された結果を、質問や照会に応じて利用者に提供できます。

Document Conversion(文書変換)

「Document Conversion(文書変換)」は、ドキュメントフォーマット変換機能です。

PDF/Word/HTMLなどのドキュメントを、Watsonで利用できるフォーマット(テキスト/JSONなど)に変換します。

Speech to Text(音声認識)

「Speech to Text(音声認識)」は、音声をテキストに変換する機能です。会話から文字を書き起こします。

日本語/英語(米英)/スペイン語/ポルトガル語/アラビア語などに対応します。キーワードの検出も可能です。より多くの音声を聞き取ることで学習して精度が向上します。

Text to Speech(音声合成)

「Text to Speech(音声合成)」は、テキストから音声を合成します。

日本語/英語/フランス語/ドイツ語/イタリア語/スペイン語などに対応します。特定の単語の発音制御も可能です。

まとめ

Watsonの日本語対応により、日本語アプリケーション開発にWatsonの高度な機能を利用できるようになりました。今後、精度はますます向上し、日本語対応APIも増えていくと見られています。

「ベトナムで、人工知能システムの開発を請け負います!」

About the author: matsumoto