No.22578 R 半角文字→全角文字への変換  【明石】 2018/07/25(Wed) 19:23

青木先生 様;

お忙しいところを失礼いたします,明石と申します。
毎々,ご丁寧なご教示をいただき,誠にありがとうございます。
改めて,御礼を申し上げます。

青木先生にご教示いただきたいことが出てきました。
何卒どうぞよろしくお願いいたします。

-------------------------

半角,全角,大文字,小文字が混在する文字列を,全角大文字に統一したいのです。

例示ですが,
moji <- "ボーイング787 ボーイング787 boeing787 Boeing787 boeing787 BOEING787"

"ボーイング787 ボーイング787 BOEING787 BOEING787 BOEING787 BOEING787"
大文字に置換は,toupper(moji)を使うえばよいことは分かりましたが,
誠に情けないのですが,半角→全角の関数を見つけることができません。

ご教示いただけましたら大変に助かります。
お手数をおかけいたします。
何卒どうぞよろしくお願いいたします。

No.22579 Re: R 半角文字→全角文字への変換  【青木繁伸】 2018/07/25(Wed) 19:53

文字の変換には基本的には chartr 関数を使えば良いです
例題の場合には,大文字変換に toupper を使えば,少し簡単に書けます
> moji = "ボーイング787 ボーイング787 boeing787 Boeing787 boeing787 BOEING787"
> moji = toupper(moji)
> chartr("A-Z0-9", "A-Z0-9", moji)
[1] "ボーイング787 ボーイング787 BOEING787 BOEING787 BOEING787 BOEING787"

> moji = "ボーイング787 ボーイング787 boeing787 Boeing787 boeing787 BOEING787"
> chartr("a-zA-Za-z0-9", "A-ZA-ZA-Z0-9", moji)
[1] "ボーイング787 ボーイング787 BOEING787 BOEING787 BOEING787 BOEING787"

No.22580 Re: R 半角文字→全角文字への変換  【明石】 2018/07/26(Thu) 09:22

青木先生 様;

お忙しいところを失礼いたします,明石と申します。

テキスト分析で,語のゆらぎを吸収する際に必要な前処理であり,大変に助かりました。

つまらない質問で,ご高名な青木先生に失礼にならないか,
小心者ですので,躊躇していましたが,
勇気をふりしぼってご相談して良かったと思います。

毎々,ご丁寧なご教示をいただき,誠にありがとうございます。
改めて,御礼を申し上げます。

● 「統計学関連なんでもあり」の過去ログ--- 048 の目次へジャンプ
● 「統計学関連なんでもあり」の目次へジャンプ
● 直前のページへ戻る