Kotz’i’jに恋して10

プログラムに何とか形態素解析を取り組みたいと思う。アルファベットを用いたキチェ語では英語の様に各単語を離して表記するため、日本語程難しくはならないと思う。ただ、動詞を用いない会話も多いため、その点が少し問題となり得る。

取り敢えず、形態素解析をひとまず隅において、Kotz’i’jがユーザーが入力した文章を用いることが出来る仕様にした。辞書ファイルへの書き込みや入力内容の評価といったことが形態素解析にも繋がるので次に向けたステップとしては中々良いかな。

まぁ、恋するプログラムも同じ手順を踏んでいるということもあるけれど。

でプログラムだけど今回は3つのソース・ファイルを修正。

Dictionary.rb

Kotzij.rb

Tzijonik.rb

プログラムの更新を分かりやすくするため、単語リストはトマト(pix)の一単語のみとしてみた。

実行してみる。

途中からKotz’ijがスペイン語を話し始めてしまった。

ちなみにXwanというのはスペイン語のJuan、Ko’zijのスペルは発音を間違えたと仮定して元々とは違う形で入力してみた。

プログラム終了時に単語リストはこうなっていた。

スペイン語を話し始めたKotz’ijだけど次回からは本格的にキチェ語を学ぶ様になるかな?まずはやはり名詞から始めようと思う。

 

Kotz’i’jに恋して9

単語数も順調に増えてきたけど、今後はKotz’i’jの発言をより充実させるものにするためには、形態素解析が必要。英語や日本語では幾つかプログラムがあるけど、キチェ語も他のマヤ諸言語もそんなものはない。

スタンフォード大学が作っている英語とかのプロジェクトを基にしても良いけど、今のところ、キチェ語の語彙数も少ないので単純なプログラムを作った方が良いかな。

取り敢えずMeCabの辞書ファイルを拾って読み込んでみた。これはかなり大変そう。形態素解析(morphological analysis)についてはノラ・イングランドがキチェ語の文法本でも触れているのでそれを参考にしてみようと思う。

 

 

Kotz’i’jに恋して7

今日午後の授業に行く前にプログラムに機能を追加した。本の第6章にあるように、Kotz’ijに感情モデルを実装した。具体的には特定の言葉によって機嫌が良くなったり、悪くなったりということ。

キチェ語クラスでの単語は150以上位だと思うけど、あまり形容詞を習っていないので今のところ機嫌を良くする言葉(Utz Kotz’i’j=可愛いKotz’i’j)と反対に機嫌を悪くさせる言葉(Chom=太っている)それぞれ一つずつ。

それらはパターン回答集に追加。.rbファイルは5つ。

Tzijonik.rb

 

Kotzij.rb

 

Responder.rb

 

Dictionary.rb

 

で最後に新しく作成したEmocion.rb

キチェ語、英語、スペイン語が入り混じってちょっと分かりずらくなってきたかなぁ。

 

 

Kotz’i’jに恋して6

キチェ語コースはまだ挨拶に留まっているけど単語数は増えてきた。動詞はまだ、殆どないけど。

コースの進行と共にKotz’ij(Kotz’i’j)も少しずつ賢くならないと!

単語リストについては後ほど書こうと思うけどGoogle SheetsからLaTex変換する方法があったので、今後はGoogle Sheetsで管理しようと思う。空いた時間に単語を入力するのはブラウザからの方がファイル管理の意味でも楽。バックアップとしては.txtファイルに変換したものをGitで管理する訳だし。

今回のプログラムにはパターン認識を新たに追加。取り敢えず三つの単語に反応する様にした。

パターン認識用の.txtファイルを新たに作成(こちら)。これはdictionariesフォルダ内に。新たにDictionary.rbを作成。

Dictionary.rb

それからKotzij.rbとResponder.rbを編集

Kotzij.rb

Responder.rb

Tzijonik.rbは今回も日付とバージョン番号の変更のみ。