OCR

Colab

【Colab】pyocrで画像からテキストを抽出しよう

Google Colaboratoryでpyocrを用いて画像から日本語のテキストを抽出します。 以下のことを検証します。 ・siriのテキストと手書きの画像からテキストを抽出 ・tessdataの辞書別にテキストを抽出 ・画像の色を反転してテキストを抽出
Homebrew

【Python】MacにMeCabを入れて自然言語処理をしてみよう(unidic-lite編)

MacにMeCabをインストールして、Pythonでの実行方法を紹介します。 今回unidic-liteを辞書としてインストールしましたがchasenが上手く動作しなかったのでその対処方法も併せて紹介していきます。
Homebrew

【Mac(M1)】tesseractでOCRを体験しよう

本投稿ではOCRエンジンであるTesseract(テッセラクト)をインストールします。 画像の文字を認識し、テキストファイルに出力することができます。 今回はMacにTesseractをインストールします。 日本語の縦書き・横書きも認識してくれるか検証してみました。