かえるのプログラミングブログ

プログラミングでつまずいたところとその解決策などを書いていきます。

2020-05-29から1日間の記事一覧

BERT で簡単に日本語の文章の特徴ベクトルを取得できるクラス作った

小ネタです。 表題の通り、日本語の特徴ベクトルを5秒で作れると嬉しいなと思ってまとめてみました。 成果物 https://github.com/osuossu8/Utils/blob/master/text_preprocess/bert_sentence_vectorizer.py 参考にさせていただいたページ huggingface/transf…

文字コードエラー

表題の内容の自分用の備忘録です。 1 ファイルの文字コード設定が原因のケース ( i ) yum install nkf -y nkf -g sample.txt nkf -w --overwrite sample.txt ( i i ) import sys, codecs import io # 3.6 =< 3.x sys.stdout = io.TextIOWrapper(sys.stdout.b…