Anthyの辞書作成::VJEの辞書を移植

VJE BSD版かっとくべきだったなーとかおもいつつ

sudo -s


変換と辞書作成

cat vje.w | nkf -w | perl hoge.pl > /usr/share/anthy/dic/vje.t
ラ五特殊 is not def. くださ くださ

米: is not def が出た場合 その単語は登録されませんので
任意でスクリプト修正してください。


使う辞書 全部使う

ls -1 /usr/share/anthy/dic/ > /etc/anthy/diclist

辞書の更新

update-anthy-dics

cp /var/lib/anthy/anthy.dic /usr/share/anthy

でログアウト/ログイン すると変更が適用されています。

# /trunk/helper/dict-canna-cclass.c とらんす
# VJEからcanna形式への変換
use strict;
use Jcode;

my %hinshi = (
#-----------------
# VJE
# ----------------

#-- category_code substantive_code[]= {
        "名ナ詞(な,さ,する,語幹,格助接続)" => "#T00", # 名詞(な,さ,する,語幹,格助接続)共通,孝行
        "名詞(な,さ,する,語幹,格助接続△)" => "#T01", # 名詞(な,さ,する,語幹,格助接続△)
        "名詞(な,さ,する,語幹)" => "#T02", # 名詞(な,さ,する,語幹)
        "名詞(な,さ,する,格助接続)" => "#T03", # 名詞(な,さ,する,格助接続)きちきち
        "名詞(な,さ,する)" => "#T04", # 名詞(な,さ,する)凶暴
        "名詞(な,さ,語幹,格助接続)" => "#T05", # 名詞(な,さ,語幹,格助接続)質実,幸運,哀れ,簡潔,謙虚,貴重
        "名詞(な,さ,語幹,格助接続△)" => "#T06", # 名詞(な,さ,語幹,格助接続△)一様,奇異,健やか,明快
        "名詞(な,さ,格助接続△)" => "#T08", # 名詞(な,さ,格助接続△)意外,懸命
        "名詞(な,さ)" => "#T09", # 名詞(な,さ)静か,気軽
        "名詞(な,する,語幹,格助接続)" => "#T10", # 名詞(な,する,語幹,格助接続)安心,浮気,横着,感心
        "名詞(な,する,語幹,格助接続△)" => "#T11", # 名詞(な,する,語幹,格助接続△)格段,格別,大層,直接
        "名詞(な,する,語幹)" => "#T12", # 名詞(な,する,語幹)存分
        "名詞(な,する,格助接続△)" => "#T13", # 名詞(な,する,格助接続△)大慌て
        "名詞(な,する)" => "#T14", # 名詞(な,する)
        "名詞・副詞(な,語幹,格助接続)" => "#T15", # 名詞・副詞(な,語幹,格助接続)同じ?,色々
        "名詞(な,格助接続△)" => "#T18", # 名詞(な,格助接続△)当り前,甘口,安穏,内気
        "名詞(な)" => "#T19", # 名詞(な)危なげ,嫌み,大ざっぱ
        "名サ" => "#T20", # 名詞(さ,する,語幹,格助接続)
        "名サ△" => "#T21", # 名詞(さ,する,語幹,格助接続△)
        "名サ詞(さ,する,語幹)" => "#T22", # 名詞(さ,する,語幹)
        "名サ詞(さ,する,格助接続△)" => "#T23", # 名詞(さ,する,格助接続△)
        "名サ詞(さ,する)" => "#T24", # 名詞(さ,する)
        "名サ詞(さ,語幹,格助接続)" => "#T25", # 名詞(さ,語幹,格助接続)平常
        "名サ詞(さ,語幹,格助接続△)" => "#T26", # 名詞(さ,語幹,格助接続△)
        "名サ詞(さ,語幹)" => "#T27", # 名詞(さ,語幹)
        "名サ詞(さ,格助接続△)" => "#T28", # 名詞(さ,格助接続△)
        "名サ他" => "#T29", # 名詞(さ)
        "名詞(する,語幹,格助接続)" => "#T30", # 名詞(する,語幹,格助接続)哀願,愛好,挨拶,安置
        "名詞(する,語幹)" => "#T32", # 名詞(する,語幹)
        "名詞(する,語幹)" => "#T32", # 名詞(する,語幹)
        "名詞(する,格助接続△)" => "#T33", # 名詞(する,格助接続△)
        "名詞(する)" => "#T34", # 名詞(する)
        "名詞建物" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社
        "名詞組織" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社
        "固名商品" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社
        "固名" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社
        "名詞(語幹,格助接続)" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社
        "名詞(語幹,格助接続)" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社
        "名詞" => "#T39", # 名詞
        "名詞人" => "#T39", # 名詞
        "名詞場所" => "#T39", # 名詞
        "名詞" => "#T39", # 名詞
        "名詞" => "#T39", # 名詞
        "地名" => "#CN", # 地名東京
        "地名行政区分" => "#CN", # 地名東京
        "接尾地名" => "#CNS", # 地名(接尾語)東京都
        "地名町名" => "#JCN", # 地名(姓も可)長崎
        "人名" => "#JN", # 人名菅井,勝
        "人姓" => "#JNS", # 人名(姓)蔵本
        "人名名" => "#JNM", # 人名(名)栄二
        "会社団体" => "#KK", # 会社/団体日本電気
        "組織" => "#KK", # 会社/団体日本電気
        "組織企業" => "#KK", # 会社/団体日本電気
        
        
#-- };
#-- category_code adverb_code[] = {
        "副詞(な,さ,語幹)" => "#T07", # 副詞(な,さ,語幹)十分
        "副詞(な,語幹,格助接続△)" => "#T16", # 副詞(な,語幹,格助接続△)案外,生憎,かなり
        "副詞(な,語幹)" => "#T17", # 副詞(な,語幹)やたら,ぴったり,意識的,印象的,科学的
        "副詞(する,語幹,格助接続△)" => "#T31", # 副詞(する,語幹,格助接続△)ちょっと
        "副詞(語幹,格助接続△)" => "#T36", # 副詞(語幹,格助接続△)よほど,たぶん,折からの
        "副詞(語幹)" => "#T37", # 副詞(語幹)だいぶ,はなはだ
        "副詞(格助接続△)" => "#T38", # 副詞(格助接続△)
        "副詞(と,たる,する,語幹)" => "#F00", # 副詞(と,たる,する,語幹)決然,ぐるぐる,ひそひそ,青々
        "副詞(と,たる,する)" => "#F01", # 副詞(と,たる,する)判然,依然,公然,雑然,釈然,泰然
        "副詞(と,たる,語幹)" => "#F02", # 副詞(と,たる,語幹)猛然,断然,断固,堂々,延々,延々
        "副詞(と,たる,)" => "#F03", # 副詞(と,たる,)広漠,安閑,憮然,唖然,黙々,切切
        "副詞(と,する,語幹)" => "#F04", # 副詞(と,する,語幹)ふっくら,ゆっくり
        "副詞(と,する)" => "#F05", # 副詞(と,する)晴れ晴れ,広々,ごわごわ,ごつごつ
        "副詞(と,語幹)" => "#F06", # 副詞(と,語幹)全然,突然,度々,重ね重ね,まざまざ,むざむざ
        "副詞(と)" => "#F07", # 副詞(と)
        "副詞(たる,する,語幹)" => "#F08", # 副詞(たる,する,語幹)
        "副詞(たる,する)" => "#F09", # 副詞(たる,する)
        "副詞(たる,語幹)" => "#F10", # 副詞(たる,語幹)
        "副詞(たる)" => "#F11", # 副詞(たる)確
        "副詞(する,語幹)" => "#F12", # 副詞(する,語幹)そっと,ぞっと,ほっと,ふと,ほっと,むっと
        "副詞" => "#F13", # 副詞(する)
        "副詞(する)" => "#F13", # 副詞(する)
        "副詞(語幹)" => "#F14", # 副詞(語幹)相変わらず,敢えて,飽くまで
        "副詞(未定義)" => "#F15", # 副詞(未定義)
#-- };
#-- /**
#--  * K5,  か行五,              置く
#--  * K5r, か行五:連用形が名詞, 書く
#--  * C5r, 行く五:連用形が名詞, 行く
#--  * G5,  が行五,              仰ぐ
#--  * G5r, が行五:連用形が名詞, 急ぐ
#--  * S5,  さ行五,              帰す
#--  * S5r, さ行五:連用形が名詞, 移す
#--  * T5,  た行五,              絶つ
#--  * T5r, た行五:連用形が名詞, 打つ
#--  * N5,  な行五,              死ぬ
#--  * B5,  ば行五,              転ぶ
#--  * B5r, ば行五:連用形が名詞, 遊ぶ
#--  * M5,  ま行五,              住む
#--  * M5r, ま行五:連用形が名詞, 編む
#--  * R5,  ら行五,              威張る
#--  * R5r, ら行五:連用形が名詞, 謝る
#--  * L5,  ラ行五:命令形がイ,   いらっしゃる
#--  * W5,  わ行五,              言う
#--  * W5r, わ行五:連用形が名詞, 扱う
#--  * U5,  乞う五,              乞う
#--  * U5r, 乞う五:連用形が名詞, 問う
#--  * KS,  上下1段,              降りる
#--  *                            与える
#--  * KSr, 上下1段:語幹が名詞,   生きる
#--  *                            預ける
#--  * KX,  カ変活用動詞,         来る
#--  * SX,  サ変活用動詞,         関する
#--  * ZX,  ザ変活用動詞,         感ずる
#--  * NZX, ンザ変活用動詞,       重んずる
#--  **/
#-- category_code verb_code[]= {
        "カ五" => "#K5", # か行五置/か(ない)/き(ます)/く/く(こと)/け(ば)/こ(う)
        "カ五ある" => "#K5r", # か行五:連名書/か(ない)/き(ます)/く/く(こと)/け(ば)/こ(う)
        "カ五いく" => "#C5r", # 行く五行/か(ない)/き(ます)/く/く(こと)/け(ば)/こ(う)
        "ガ五" => "#G5", # が行五仰/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う)
        "ガ五ある" => "#G5r", # が行五:連名急/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う)
        "サ五" => "#S5", # さ行五帰/さ(ない)/し(ます)/す/す(こと)/せ(ば)/そ(う)
        "サ五ある" => "#S5r", # さ行五:連名移/さ(ない)/し(ます)/す/す(こと)/せ(ば)/そ(う)
        "タ五" => "#T5", # た行五絶/た(ない)/ち(ます)/つ/つ(こと)/て(ば)/と(う)
        "タ五ある" => "#T5r", # た行五:連名打/た(ない)/ち(ます)/つ/つ(こと)/て(ば)/と(う)
        "ナ五" => "#N5", # な行五死/な(ない)/に(ます)/ぬ/ぬ(こと)/ね(ば)/の(う)
        "ナ五ある" => "#N5r", # な行五:連名
        "バ五" => "#B5", # ば行五転/ば(ない)/び(ます)/ぶ/ぶ(こと)/べ(ば)/ぼ(う)
        "バ五ある" => "#B5r", # ば行五:連名遊/ば(ない)/び(ます)/ぶ/ぶ(こと)/べ(ば)/ぼ(う)
        "マ五" => "#M5", # ま行五住/ま(ない)/み(ます)/む/む(こと)/め(ば)/も(う)
        "マ五ある" => "#M5r", # ま行五:連名編/ま(ない)/み(ます)/む/む(こと)/め(ば)/も(う)
        "ラ五" => "#R5", # ら行五威張/ら(ない)/り(ます)/る/る(こと)/れ(ば)/ろ(う)
        "ラ五ある" => "#R5r", # ら行五:連名謝/ら(ない)/り(ます)/る/る(こと)/れ(ば)/ろ(う)
        "ラ五ける" => "#L5", # ラ行五:命令イいらっしゃ/ら(ない)/い(ます)/る/る(こと)/れ(ば)/ろ(う)
        "ワ五" => "#W5", # わ行五言/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う)
        "ワ五:連名" => "#W5r", # わ行五:連名扱/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う)
        "乞う五" => "#U5", # 乞う五乞/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う)
        "乞う五:連名" => "#U5r", # 乞う五:連名問/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う)
      #  "一上" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う)
        "一段" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う)
      #  "一下" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う)
        "上下1段" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う)
        "上下1段:語幹名" => "#KSr", # 上下1段:語幹名生,預/き,け(ない)/き,け(ます)/きる,ける/きる,ける(こと)/きれ,けれ(ば)/きよ,けよ(う)
        "カ変" => "#KX", # カ変活用動詞来/こ(ない)/き(ます)/くる/くる(こと)/くれ(ば)/こよ(う)
        "サ変" => "#SX", # サ変活用動詞関/し(ない)/し(ます)/する/する(こと)/すれ(ば)/せよ
        "ザ変" => "#ZX", # ザ変活用動詞感/じ(ない)/じ(ます)/ずる/ずる(こと)/ずれ(ば)/ぜよ
        "ンザ変" => "#NZX", # ンザ変活用動詞重ん/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う)
        "カ変する" => "#KX", # カ変活用動詞来/こ(ない)/き(ます)/くる/くる(こと)/くれ(ば)/こよ(う)
        "サ変する" => "#SX", # サ変活用動詞関/し(ない)/し(ます)/する/する(こと)/すれ(ば)/せよ
        "ザ変する" => "#ZX", # ザ変活用動詞感/じ(ない)/じ(ます)/ずる/ずる(こと)/ずれ(ば)/ぜよ
        "ンザ変する" => "#NZX", # ンザ変活用動詞重ん/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う)
#-- };
#-- /***
#--  * KY,    形                   美しい
#--  * KYT,   名ナノ・形    四角い,黄色い
#--  * KYna,  形            小さい,大きい  (活用に[な(連体用法ナ]がある形容詞)
#--  * KYmi,  形            強い、重い     (みで終ると名詞に転成する形容詞)
#--  * KYme,  形            強め、長め     (めで終ると形容動詞に転成する形容詞)
#--  * KYmime,形            強み、強め     KYmi, KYme の両方の性質を合わせ持つ
#--  * KYU,   形:ウ音便     美しゅう
#--  **/
#-- category_code adjective_code[] = {
        "形容" => "#KY", # 形容詞美しい
        "名形" => "#KYT", # 形容詞:名ナノ四角い, 黄色い
        "形容詞:連体用法ナ" => "#KYna", # 形容詞:連体用法ナ小さい, 大きい
        "形容詞:み" => "#KYmi", # 形容詞:み強い, 重い
        "形容詞:め" => "#KYme", # 形容詞:め強め, 長め
        "形動特殊" => "#KYmime", # 形容詞:みめ強み, 強め
        "形容う" => "#KYU", # 形容詞:ウ音便美しゅう
#-- };
#-- category_code etc_code[] = {
        "独立語" => "#KJ", # 一文字漢字単漢字変換用
        "単漢" => "#KJ", # 一文字漢字単漢字変換用
        "一文字漢字" => "#KJ", # 一文字漢字単漢字変換用
#-- /*
        "地名" => "#CN", # 地名東京
        "地名(接尾語)" => "#CNS", # 地名(接尾語)東京都
        "地名(姓も可)" => "#JCN", # 地名(姓も可)長崎
        "人名" => "#JN", # 人名菅井,勝
        "人名(姓)" => "#JNS", # 人名(姓)蔵本
        "人名(名)" => "#JNM", # 人名(名)栄二
        "会社団体" => "#KK", # 会社/団体日本電気
#-- */
        "接続" => "#CJ", # 接続詞/感動詞/連語
        "感動" => "#CJ", # 接続詞/感動詞/連語
        "連語" => "#CJ", # 接続詞/感動詞/連語
        "接続詞/感動詞/連語" => "#CJ", # 接続詞/感動詞/連語
        "連体" => "#RT", # 連体詞
        "動詞の丁寧表現の語幹" => "#OKX", # 動詞の丁寧表現の語幹お聞き
        "数詞" => "#NN", # 数詞:一般数,幾 
        "名詞数詞" => "#NN", # 数詞:一般数,幾 
        "数詞特殊" => "#NN", # 数詞:一般数,幾 
  
        "数詞:x万,x億,x兆" => "#N00", # 数詞:x万,x億,x兆x万,x億,x兆
        "数詞:千,二千,…,数千" => "#N01", # 数詞:千,二千,…,数千千,二千,…,数千
        "数詞:百,二百,…,数百" => "#N02", # 数詞:百,二百,…,数百百,二百,…,数百
        "数詞:十,二十,…,数十" => "#N03", # 数詞:十,二十,…,数十十,二十,…,数十
        "形式名詞" => "#KN", # 形式名詞あと/うち/おり/こと/
        "新形式名詞" => "#TKN", # 新形式名詞はず/わけ
        "準体言名詞" => "#JTNO", # 準体言名詞くらい/ぐらい/こそ
        "接頭" => "#PRE", # 接頭語
        "接頭一般" => "#CNPRE", # 接頭一般
        "接頭地名" => "#JNPRE", # 接頭地名
        "冠数" => "#NNPRE", # 接頭数詞
        "接頭サ変名詞" => "#SNPRE", # 接頭サ変名詞
        "接尾" => "#SUN", # 接尾一般
        "接尾地名 1" => "#CNSUC1", # 接尾地名 1
        "接尾地名 2" => "#CNSUC2", # 接尾地名 2
        "接尾人名" => "#JNSUC", # 接尾人名
        "接尾サ変名詞化" => "#N2T30", # 接尾サ変名詞化(名)+化,視
        "接尾名詞化" => "#N2T35", # 接尾名詞化
        "接尾動詞連用形+名詞化" => "#D2T35", # 接尾動詞連用形+名詞化(動詞連用形)+っぱなし
        "形動" => "#D2T16", # 接尾形容動詞化(動詞連用形)+がち
        "接尾形容詞化" => "#ND2KY", # 接尾形容詞化(名,動用)+がましい,強(づよ)い: 押し付けがましい
        "接尾形容詞化(動詞連用形)" => "#D2KY", # 接尾形容詞化(動詞連用形)(動連)+しづらい,難(がた)い
        "接尾形容詞化(名ナノ)" => "#N2KYT", # 接尾形容詞化(名ナノ)(名)+高(だか)い,早(ばや)い: 名高い,手早い
        "特殊活用:形容動詞化(T10)" => "#N2T10", # 特殊活用:形容動詞化(T10)(名)+づかい
        "特殊活用:形容動詞化(T15)" => "#N2T15", # 特殊活用:形容動詞化(T15)(名)+ずくめ
        "特殊活用:形容動詞化(T16)" => "#N2T16", # 特殊活用:形容動詞化(T16)(名)+的,式,風,流
        "特殊活用:形容動詞化(T17)" => "#N2T17", # 特殊活用:形容動詞化(T17)
        "特殊活用:形容動詞化(T18)" => "#N2T18", # 特殊活用:形容動詞化(T18)(名)+みたい,がち
        "助数" => "#JS", # 数助詞
        "助数接尾語" => "#JSSUC", # 数助詞接尾語
        "接尾人名" => "#JNMUC", # 接尾人名(名)
        "接尾名" => "#JNMSUC", # 接尾名
        "接尾姓" => "#JNSSUC", # 接尾姓
#-- };
    
);

while(<>)
{
#kasumi -a --sound ho --spelling ge --wordclass
#mkworddic / mkfiledic
chomp;

/^(\S+)\s+(\S+)\s+(【|[)(\S+)(】|])\*?\s+\@([0-9A-Fa-f]+)?/ or next;

my($sound,$spelling,$class,$wordclass, $score) =($1,$2,$4,$hinshi{$4},$6*10);
unless($wordclass) {
print stderr "$class is not def. $sound $spelling
";
	next;
}
 
$sound = jcode($sound,'utf8')->euc;
$spelling = jcode($spelling,'utf8')->euc;
print "$sound $wordclass $spelling
";

}