MeCabのインストールをUbuntu以外のLinux(OpenSUSE)から行う場合、こちらのインストール方法を参考にソースからコンパイルする必要があると思います。
MeCabのインストールはうまく行くのですが、ipadicのインストールの際にエラーが発生しました。
バージョンも数年前から変わっていないと思うのですが、今更初めてのエラーが出ましたので対策を残しておきます。
Python3 gensimでUnicodeDecodeError
久しぶりにgensimのword2vecを使いたいなと思ってやってたら、model作成の際にエラーが出て悩んだ。下記のようなエラーである。
UnicodeDecodeError: 'utf-8' codec can't decode...
結論から言うと、学習用txtファイルがおかしくなっていたみたい。iconvコマンドでエンコーディングを確認すると、utf-8になっていたのだが、nkfコマンドでエンコーディングを確認すると何故かBINARYと表示されていた。
原因
原因は学習用のファイルを作成の際に行うmecabのowakatiがうまく行ってなかったようだ。
mecab -Owakati input.txt -o data.txt
としていたが、確かにこのときOVERFLOW...的なことを言っていた。
雰囲気上、問題無い感じで出来上がり、ファイルも開けていたので気にしていなかったが、これが原因だったみたいである。
mecab -b 81920 -Owakati input.txt -o data.txt
上記のようにメモリサイズを指定する必要がある。昔書いた記事に書いてて、実際にそれを見て思い出した(笑)
ただし、このときは別のエラーが起きていた気がする。
何はともあれ治ったので良かった。なんかあんまりこのエラーについて情報なかったけど、たしかに下準備からのエラーだからか。
それにしても、なぜiconvはUTF-8と判断したのか謎である…。
LinuxでPDFから背景白色のJPGファイルを作成する方法
convertコマンドを使う
実際に使うコマンドを下記に示します。
$ convert input.pdf -density 300 -alpha Remove output.jpg
316円(税込)でおしゃれ?なイヤホンケースの作り方
はじめに
私はポータブルオーディオが結構好きで、イヤホン・ヘッドホンを複数所持しています。最近はイヤホンケース付きで販売するイヤホンも多くなったのですが、低価格帯のイヤホンにはあまり付属しません。しかし、イヤホンケースって買うと意外とかかります。個人的な意見ですが、3000円のイヤホンに1000円のイヤホンケースはもったいないなと思います。また、ソニーのイヤホンをオーディオテクニカのケースに入れるは微妙に嫌です(これは理解してもらえなさそう^^;)。
イヤホンを裸で持ち歩くとイヤホンの寿命を縮めるかもしれません。そこで、百円ショップ(Seria)に売ってるものだけで、おしゃれかつ保護力の高いイヤホンケースを作成してみました。
TornadoでHTMLタグを出力する方法
Tornadoでは、
<body> {{"<h1>Hello World!!</h1>"}} </body>
で出力できるのは有名ですが、この時htmlタグもそのまま表示されます。
つまり、<h1>Hello World!!</h1>みたいになります。
これを解決する方法をあまり日本語記事で見つけられず、試行錯誤していました。しかし、やっとStack Over Flowで見つけましたので、残しておきます。