文章を楽に読むための試行錯誤
辞書拡張機能Google Dictionaryと
Janomeで分かち書き

「書いてあるでしょ!」や「読めばわかる」とは言われても、
フォローは欲しいところです。

ちょっと抵抗を試みます。

形態素解析ライブラリ「Janome」

楽に読む 読んでおいてくださいは残念!?

税理士になってから言わないようにしていることに、

  • 「読んでおいてください」

というフレーズがあります。

税務会計業務に関わらず、丁寧な資料を作成することは、

  • 誤解が生じない
  • 効率的な

仕事上のコミュニケーション手段だと思っていました。

ところが、現実には丁寧に作成したはずの資料は、

  • 斜め読みところか
  • 放置された状態で
  • 参照されることがない

といった残念な状態ということがよくありました。

図解やイラスト、構成、フォントなどに配慮しても
資料の提示だけではコミュニケーションとしては不完全です。

資料と業務との関連も伝えておくべきだったわけです。

また、文章が読めるとはいっても、

  • 見慣れないことば
  • 普段使わない表現

といった資料は読み手には苦痛のタネです。

自分の専門分野以外での資料の読解を想定してみると
納得しやすい印象です。

とはいえ、なんでもかんでも対面での説明を求める
ことも現実的ではありません。

文章・テキスト資料とのつきあい方に工夫が必要です。

ツールを使って試行錯誤してみます。

楽に読む 拡張機能Google Dictionary

外国の方が日本語の学習をする際にGoogle Chrome の拡張機能で
辞書ツールを利用されているようです。

  • rikakun/rikachan
  • Yomichan
  • Japanese IO etc.

日本人にとって日常語の日本語といっても、
普段使っていないことばは外国語のようなものです。

Google Chromeの拡張機能「Google Dictionary」を使ってみます。

アイコンをクリックして、日本語で利用できるように設定しておきます。

Google Dictionaryはブラウザ上で表示されていることばを、

  • ドラック → ダブルクリック

といった操作で意味を検索できます。

一般的なことばの意味をページ遷移せずに確認できます

使いやすいのですが、専門用語の対応は充分ではないので留意が必要です。。

楽に読む Janomeで分かち書き

私は古典(古文)は嫌いではないのですが、苦手意識があります。

文字、とくに「分かち書き」されていないひらがな表記です。

日本語は文節の切れ目に余白を設ける分かち書きをしません。

長文でのことばのつながりを読みとる際に負担を感じる
ということもあります。

プログラミング言語Pythonで形態素解析ライブラリ「Janomeジャノメ
を使うと、サクッと分かち書き処理ができます。

Janomeをインストールします。
 (Google Colaboratoryを使用しました)

実際の成果は以下の通りです。

日本語の分かち書きへの処理は可能です。

実利的な運用については、今後の課題です(笑)。

「難しそう」・「わからないはず」という印象がある対象の資料は
読まずに放置しがちです。

功利的な発想を重視するならば、読まないのは損です。

食い下がる試行錯誤に魅力があるはずです。

今回のサンプルコード

pip install janome
from janome.tokenizer import Tokenizer
import re
tokenizer = Tokenizer(wakati=True)
result = tokenizer.tokenize(‘2023年10月から消費税インボイス制度が始まります’)
print(‘ ‘.join(result))

 

蛇足
「形態素解析」を「プログラミング」で達成しました。
自分の能力やスキルが向上した成果である、
というほど自惚うぬぼれてはいません。
あっさり実現して、驚いているだけです(笑)。

<ご案内>

■林友範税理士事務所

ご依頼はこちらから

■副業をされている方も応援しています!

副業から始める確定申告セミナー動画