Anthyの辞書作成::VJEの辞書を移植
VJE BSD版かっとくべきだったなーとかおもいつつ
sudo -s
変換と辞書作成
cat vje.w | nkf -w | perl hoge.pl > /usr/share/anthy/dic/vje.t
ラ五特殊 is not def. くださ くださ
米: is not def が出た場合 その単語は登録されませんので
任意でスクリプト修正してください。
使う辞書 全部使う
辞書の更新
update-anthy-dics
でログアウト/ログイン すると変更が適用されています。
- hoge.pl
# /trunk/helper/dict-canna-cclass.c とらんす # VJEからcanna形式への変換 use strict; use Jcode; my %hinshi = ( #----------------- # VJE # ---------------- #-- category_code substantive_code[]= { "名ナ詞(な,さ,する,語幹,格助接続)" => "#T00", # 名詞(な,さ,する,語幹,格助接続)共通,孝行 "名詞(な,さ,する,語幹,格助接続△)" => "#T01", # 名詞(な,さ,する,語幹,格助接続△) "名詞(な,さ,する,語幹)" => "#T02", # 名詞(な,さ,する,語幹) "名詞(な,さ,する,格助接続)" => "#T03", # 名詞(な,さ,する,格助接続)きちきち "名詞(な,さ,する)" => "#T04", # 名詞(な,さ,する)凶暴 "名詞(な,さ,語幹,格助接続)" => "#T05", # 名詞(な,さ,語幹,格助接続)質実,幸運,哀れ,簡潔,謙虚,貴重 "名詞(な,さ,語幹,格助接続△)" => "#T06", # 名詞(な,さ,語幹,格助接続△)一様,奇異,健やか,明快 "名詞(な,さ,格助接続△)" => "#T08", # 名詞(な,さ,格助接続△)意外,懸命 "名詞(な,さ)" => "#T09", # 名詞(な,さ)静か,気軽 "名詞(な,する,語幹,格助接続)" => "#T10", # 名詞(な,する,語幹,格助接続)安心,浮気,横着,感心 "名詞(な,する,語幹,格助接続△)" => "#T11", # 名詞(な,する,語幹,格助接続△)格段,格別,大層,直接 "名詞(な,する,語幹)" => "#T12", # 名詞(な,する,語幹)存分 "名詞(な,する,格助接続△)" => "#T13", # 名詞(な,する,格助接続△)大慌て "名詞(な,する)" => "#T14", # 名詞(な,する) "名詞・副詞(な,語幹,格助接続)" => "#T15", # 名詞・副詞(な,語幹,格助接続)同じ?,色々 "名詞(な,格助接続△)" => "#T18", # 名詞(な,格助接続△)当り前,甘口,安穏,内気 "名詞(な)" => "#T19", # 名詞(な)危なげ,嫌み,大ざっぱ "名サ" => "#T20", # 名詞(さ,する,語幹,格助接続) "名サ△" => "#T21", # 名詞(さ,する,語幹,格助接続△) "名サ詞(さ,する,語幹)" => "#T22", # 名詞(さ,する,語幹) "名サ詞(さ,する,格助接続△)" => "#T23", # 名詞(さ,する,格助接続△) "名サ詞(さ,する)" => "#T24", # 名詞(さ,する) "名サ詞(さ,語幹,格助接続)" => "#T25", # 名詞(さ,語幹,格助接続)平常 "名サ詞(さ,語幹,格助接続△)" => "#T26", # 名詞(さ,語幹,格助接続△) "名サ詞(さ,語幹)" => "#T27", # 名詞(さ,語幹) "名サ詞(さ,格助接続△)" => "#T28", # 名詞(さ,格助接続△) "名サ他" => "#T29", # 名詞(さ) "名詞(する,語幹,格助接続)" => "#T30", # 名詞(する,語幹,格助接続)哀願,愛好,挨拶,安置 "名詞(する,語幹)" => "#T32", # 名詞(する,語幹) "名詞(する,語幹)" => "#T32", # 名詞(する,語幹) "名詞(する,格助接続△)" => "#T33", # 名詞(する,格助接続△) "名詞(する)" => "#T34", # 名詞(する) "名詞建物" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社 "名詞組織" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社 "固名商品" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社 "固名" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社 "名詞(語幹,格助接続)" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社 "名詞(語幹,格助接続)" => "#T35", # 名詞(語幹,格助接続)合印,合鍵,山,会社 "名詞" => "#T39", # 名詞 "名詞人" => "#T39", # 名詞 "名詞場所" => "#T39", # 名詞 "名詞" => "#T39", # 名詞 "名詞" => "#T39", # 名詞 "地名" => "#CN", # 地名東京 "地名行政区分" => "#CN", # 地名東京 "接尾地名" => "#CNS", # 地名(接尾語)東京都 "地名町名" => "#JCN", # 地名(姓も可)長崎 "人名" => "#JN", # 人名菅井,勝 "人姓" => "#JNS", # 人名(姓)蔵本 "人名名" => "#JNM", # 人名(名)栄二 "会社団体" => "#KK", # 会社/団体日本電気 "組織" => "#KK", # 会社/団体日本電気 "組織企業" => "#KK", # 会社/団体日本電気 #-- }; #-- category_code adverb_code[] = { "副詞(な,さ,語幹)" => "#T07", # 副詞(な,さ,語幹)十分 "副詞(な,語幹,格助接続△)" => "#T16", # 副詞(な,語幹,格助接続△)案外,生憎,かなり "副詞(な,語幹)" => "#T17", # 副詞(な,語幹)やたら,ぴったり,意識的,印象的,科学的 "副詞(する,語幹,格助接続△)" => "#T31", # 副詞(する,語幹,格助接続△)ちょっと "副詞(語幹,格助接続△)" => "#T36", # 副詞(語幹,格助接続△)よほど,たぶん,折からの "副詞(語幹)" => "#T37", # 副詞(語幹)だいぶ,はなはだ "副詞(格助接続△)" => "#T38", # 副詞(格助接続△) "副詞(と,たる,する,語幹)" => "#F00", # 副詞(と,たる,する,語幹)決然,ぐるぐる,ひそひそ,青々 "副詞(と,たる,する)" => "#F01", # 副詞(と,たる,する)判然,依然,公然,雑然,釈然,泰然 "副詞(と,たる,語幹)" => "#F02", # 副詞(と,たる,語幹)猛然,断然,断固,堂々,延々,延々 "副詞(と,たる,)" => "#F03", # 副詞(と,たる,)広漠,安閑,憮然,唖然,黙々,切切 "副詞(と,する,語幹)" => "#F04", # 副詞(と,する,語幹)ふっくら,ゆっくり "副詞(と,する)" => "#F05", # 副詞(と,する)晴れ晴れ,広々,ごわごわ,ごつごつ "副詞(と,語幹)" => "#F06", # 副詞(と,語幹)全然,突然,度々,重ね重ね,まざまざ,むざむざ "副詞(と)" => "#F07", # 副詞(と) "副詞(たる,する,語幹)" => "#F08", # 副詞(たる,する,語幹) "副詞(たる,する)" => "#F09", # 副詞(たる,する) "副詞(たる,語幹)" => "#F10", # 副詞(たる,語幹) "副詞(たる)" => "#F11", # 副詞(たる)確 "副詞(する,語幹)" => "#F12", # 副詞(する,語幹)そっと,ぞっと,ほっと,ふと,ほっと,むっと "副詞" => "#F13", # 副詞(する) "副詞(する)" => "#F13", # 副詞(する) "副詞(語幹)" => "#F14", # 副詞(語幹)相変わらず,敢えて,飽くまで "副詞(未定義)" => "#F15", # 副詞(未定義) #-- }; #-- /** #-- * K5, か行五, 置く #-- * K5r, か行五:連用形が名詞, 書く #-- * C5r, 行く五:連用形が名詞, 行く #-- * G5, が行五, 仰ぐ #-- * G5r, が行五:連用形が名詞, 急ぐ #-- * S5, さ行五, 帰す #-- * S5r, さ行五:連用形が名詞, 移す #-- * T5, た行五, 絶つ #-- * T5r, た行五:連用形が名詞, 打つ #-- * N5, な行五, 死ぬ #-- * B5, ば行五, 転ぶ #-- * B5r, ば行五:連用形が名詞, 遊ぶ #-- * M5, ま行五, 住む #-- * M5r, ま行五:連用形が名詞, 編む #-- * R5, ら行五, 威張る #-- * R5r, ら行五:連用形が名詞, 謝る #-- * L5, ラ行五:命令形がイ, いらっしゃる #-- * W5, わ行五, 言う #-- * W5r, わ行五:連用形が名詞, 扱う #-- * U5, 乞う五, 乞う #-- * U5r, 乞う五:連用形が名詞, 問う #-- * KS, 上下1段, 降りる #-- * 与える #-- * KSr, 上下1段:語幹が名詞, 生きる #-- * 預ける #-- * KX, カ変活用動詞, 来る #-- * SX, サ変活用動詞, 関する #-- * ZX, ザ変活用動詞, 感ずる #-- * NZX, ンザ変活用動詞, 重んずる #-- **/ #-- category_code verb_code[]= { "カ五" => "#K5", # か行五置/か(ない)/き(ます)/く/く(こと)/け(ば)/こ(う) "カ五ある" => "#K5r", # か行五:連名書/か(ない)/き(ます)/く/く(こと)/け(ば)/こ(う) "カ五いく" => "#C5r", # 行く五行/か(ない)/き(ます)/く/く(こと)/け(ば)/こ(う) "ガ五" => "#G5", # が行五仰/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う) "ガ五ある" => "#G5r", # が行五:連名急/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う) "サ五" => "#S5", # さ行五帰/さ(ない)/し(ます)/す/す(こと)/せ(ば)/そ(う) "サ五ある" => "#S5r", # さ行五:連名移/さ(ない)/し(ます)/す/す(こと)/せ(ば)/そ(う) "タ五" => "#T5", # た行五絶/た(ない)/ち(ます)/つ/つ(こと)/て(ば)/と(う) "タ五ある" => "#T5r", # た行五:連名打/た(ない)/ち(ます)/つ/つ(こと)/て(ば)/と(う) "ナ五" => "#N5", # な行五死/な(ない)/に(ます)/ぬ/ぬ(こと)/ね(ば)/の(う) "ナ五ある" => "#N5r", # な行五:連名 "バ五" => "#B5", # ば行五転/ば(ない)/び(ます)/ぶ/ぶ(こと)/べ(ば)/ぼ(う) "バ五ある" => "#B5r", # ば行五:連名遊/ば(ない)/び(ます)/ぶ/ぶ(こと)/べ(ば)/ぼ(う) "マ五" => "#M5", # ま行五住/ま(ない)/み(ます)/む/む(こと)/め(ば)/も(う) "マ五ある" => "#M5r", # ま行五:連名編/ま(ない)/み(ます)/む/む(こと)/め(ば)/も(う) "ラ五" => "#R5", # ら行五威張/ら(ない)/り(ます)/る/る(こと)/れ(ば)/ろ(う) "ラ五ある" => "#R5r", # ら行五:連名謝/ら(ない)/り(ます)/る/る(こと)/れ(ば)/ろ(う) "ラ五ける" => "#L5", # ラ行五:命令イいらっしゃ/ら(ない)/い(ます)/る/る(こと)/れ(ば)/ろ(う) "ワ五" => "#W5", # わ行五言/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う) "ワ五:連名" => "#W5r", # わ行五:連名扱/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う) "乞う五" => "#U5", # 乞う五乞/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う) "乞う五:連名" => "#U5r", # 乞う五:連名問/わ(ない)/い(ます)/う/う(こと)/え(ば)/お(う) # "一上" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う) "一段" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う) # "一下" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う) "上下1段" => "#KS", # 上下1段降,与/り,え(ない)/り,え(ます)/りる,える/りる,える(こと)/りれ,えれ(ば)/りよ,えよ(う) "上下1段:語幹名" => "#KSr", # 上下1段:語幹名生,預/き,け(ない)/き,け(ます)/きる,ける/きる,ける(こと)/きれ,けれ(ば)/きよ,けよ(う) "カ変" => "#KX", # カ変活用動詞来/こ(ない)/き(ます)/くる/くる(こと)/くれ(ば)/こよ(う) "サ変" => "#SX", # サ変活用動詞関/し(ない)/し(ます)/する/する(こと)/すれ(ば)/せよ "ザ変" => "#ZX", # ザ変活用動詞感/じ(ない)/じ(ます)/ずる/ずる(こと)/ずれ(ば)/ぜよ "ンザ変" => "#NZX", # ンザ変活用動詞重ん/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う) "カ変する" => "#KX", # カ変活用動詞来/こ(ない)/き(ます)/くる/くる(こと)/くれ(ば)/こよ(う) "サ変する" => "#SX", # サ変活用動詞関/し(ない)/し(ます)/する/する(こと)/すれ(ば)/せよ "ザ変する" => "#ZX", # ザ変活用動詞感/じ(ない)/じ(ます)/ずる/ずる(こと)/ずれ(ば)/ぜよ "ンザ変する" => "#NZX", # ンザ変活用動詞重ん/が(ない)/ぎ(ます)/ぐ/ぐ(こと)/げ(ば)/ご(う) #-- }; #-- /*** #-- * KY, 形 美しい #-- * KYT, 名ナノ・形 四角い,黄色い #-- * KYna, 形 小さい,大きい (活用に[な(連体用法ナ]がある形容詞) #-- * KYmi, 形 強い、重い (みで終ると名詞に転成する形容詞) #-- * KYme, 形 強め、長め (めで終ると形容動詞に転成する形容詞) #-- * KYmime,形 強み、強め KYmi, KYme の両方の性質を合わせ持つ #-- * KYU, 形:ウ音便 美しゅう #-- **/ #-- category_code adjective_code[] = { "形容" => "#KY", # 形容詞美しい "名形" => "#KYT", # 形容詞:名ナノ四角い, 黄色い "形容詞:連体用法ナ" => "#KYna", # 形容詞:連体用法ナ小さい, 大きい "形容詞:み" => "#KYmi", # 形容詞:み強い, 重い "形容詞:め" => "#KYme", # 形容詞:め強め, 長め "形動特殊" => "#KYmime", # 形容詞:みめ強み, 強め "形容う" => "#KYU", # 形容詞:ウ音便美しゅう #-- }; #-- category_code etc_code[] = { "独立語" => "#KJ", # 一文字漢字単漢字変換用 "単漢" => "#KJ", # 一文字漢字単漢字変換用 "一文字漢字" => "#KJ", # 一文字漢字単漢字変換用 #-- /* "地名" => "#CN", # 地名東京 "地名(接尾語)" => "#CNS", # 地名(接尾語)東京都 "地名(姓も可)" => "#JCN", # 地名(姓も可)長崎 "人名" => "#JN", # 人名菅井,勝 "人名(姓)" => "#JNS", # 人名(姓)蔵本 "人名(名)" => "#JNM", # 人名(名)栄二 "会社団体" => "#KK", # 会社/団体日本電気 #-- */ "接続" => "#CJ", # 接続詞/感動詞/連語 "感動" => "#CJ", # 接続詞/感動詞/連語 "連語" => "#CJ", # 接続詞/感動詞/連語 "接続詞/感動詞/連語" => "#CJ", # 接続詞/感動詞/連語 "連体" => "#RT", # 連体詞 "動詞の丁寧表現の語幹" => "#OKX", # 動詞の丁寧表現の語幹お聞き "数詞" => "#NN", # 数詞:一般数,幾 "名詞数詞" => "#NN", # 数詞:一般数,幾 "数詞特殊" => "#NN", # 数詞:一般数,幾 "数詞:x万,x億,x兆" => "#N00", # 数詞:x万,x億,x兆x万,x億,x兆 "数詞:千,二千,…,数千" => "#N01", # 数詞:千,二千,…,数千千,二千,…,数千 "数詞:百,二百,…,数百" => "#N02", # 数詞:百,二百,…,数百百,二百,…,数百 "数詞:十,二十,…,数十" => "#N03", # 数詞:十,二十,…,数十十,二十,…,数十 "形式名詞" => "#KN", # 形式名詞あと/うち/おり/こと/ "新形式名詞" => "#TKN", # 新形式名詞はず/わけ "準体言名詞" => "#JTNO", # 準体言名詞くらい/ぐらい/こそ "接頭" => "#PRE", # 接頭語 "接頭一般" => "#CNPRE", # 接頭一般 "接頭地名" => "#JNPRE", # 接頭地名 "冠数" => "#NNPRE", # 接頭数詞 "接頭サ変名詞" => "#SNPRE", # 接頭サ変名詞 "接尾" => "#SUN", # 接尾一般 "接尾地名 1" => "#CNSUC1", # 接尾地名 1 "接尾地名 2" => "#CNSUC2", # 接尾地名 2 "接尾人名" => "#JNSUC", # 接尾人名 "接尾サ変名詞化" => "#N2T30", # 接尾サ変名詞化(名)+化,視 "接尾名詞化" => "#N2T35", # 接尾名詞化 "接尾動詞連用形+名詞化" => "#D2T35", # 接尾動詞連用形+名詞化(動詞連用形)+っぱなし "形動" => "#D2T16", # 接尾形容動詞化(動詞連用形)+がち "接尾形容詞化" => "#ND2KY", # 接尾形容詞化(名,動用)+がましい,強(づよ)い: 押し付けがましい "接尾形容詞化(動詞連用形)" => "#D2KY", # 接尾形容詞化(動詞連用形)(動連)+しづらい,難(がた)い "接尾形容詞化(名ナノ)" => "#N2KYT", # 接尾形容詞化(名ナノ)(名)+高(だか)い,早(ばや)い: 名高い,手早い "特殊活用:形容動詞化(T10)" => "#N2T10", # 特殊活用:形容動詞化(T10)(名)+づかい "特殊活用:形容動詞化(T15)" => "#N2T15", # 特殊活用:形容動詞化(T15)(名)+ずくめ "特殊活用:形容動詞化(T16)" => "#N2T16", # 特殊活用:形容動詞化(T16)(名)+的,式,風,流 "特殊活用:形容動詞化(T17)" => "#N2T17", # 特殊活用:形容動詞化(T17) "特殊活用:形容動詞化(T18)" => "#N2T18", # 特殊活用:形容動詞化(T18)(名)+みたい,がち "助数" => "#JS", # 数助詞 "助数接尾語" => "#JSSUC", # 数助詞接尾語 "接尾人名" => "#JNMUC", # 接尾人名(名) "接尾名" => "#JNMSUC", # 接尾名 "接尾姓" => "#JNSSUC", # 接尾姓 #-- }; ); while(<>) { #kasumi -a --sound ho --spelling ge --wordclass #mkworddic / mkfiledic chomp; /^(\S+)\s+(\S+)\s+(【|[)(\S+)(】|])\*?\s+\@([0-9A-Fa-f]+)?/ or next; my($sound,$spelling,$class,$wordclass, $score) =($1,$2,$4,$hinshi{$4},$6*10); unless($wordclass) { print stderr "$class is not def. $sound $spelling "; next; } $sound = jcode($sound,'utf8')->euc; $spelling = jcode($spelling,'utf8')->euc; print "$sound $wordclass $spelling "; }