The jonki

呼ばれて飛び出てじょじょじょじょーんき

ゼロから作った形態素解析器Taiyakiで学ぶ形態素解析

本記事は,自然言語処理 Advent Calendar 2019 - Qiitaの1日目の記事です. はじめに 今回の記事では,去年末ごろからPythonとCythonだけでチマチマ作った形態素解析器Taiyakiをベースに,形態素解析器の解説をしようかなと思います.この形態素解析器の完…

macOS CatalinaでKarabiner-Elementsを動かす

macOS Catalinaのpublic betaを入れたらKarabiner-Elementsが動かなくなったのでメモ.基本的には公式対応を待った方が良いが,もうアップデートしてしまった方は下記issueをウォッチしておくのをオススメする.今回は本日7/3時点でのワークアラウンドを説明…

NMAX 155にUSB電源をつける

今回は珍しくバイクの改造ブログです.最近NMAX 155(2018)を買ったので,それにUSB電源を付けてみました.もう多くの方がやっていると思いますが,参考になる写真はいくつ合っても良いと思うので書いてみます. またこの記事を参考にして行う作業は自己責…

NAACL 2019のBest Paper Awardsを一人で読み会

NAACL 2019のBest Paper Awardsが公開されていましたので,1件を除いた*1ペーパーをLeading NLP Ninjaで解説しました. Best Long Paper BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding anchor.fm Best Short Paper Pr…

ギブスサンプリング入門

前回2次元のガウス分布を条件付き確率により得られた1次元ガウス分布から推定する記事を書きましたが,今回はもっと単純な例で説明します. www.jonki.net というのもGraham先生のチュートリアル資料(トピックモデル)にかなり分かりやすい例があったので…

2次元ガウス分布をギブスサンプリングする

2019/5/3 更新 ギブスサンプリングの簡単な例題を説明した記事を書いたので,こちらを先に見たほうが理解が進むかもしれません. www.jonki.net ベイズ推論を勉強中に,サンプリングの1つ,ギブスサンプリングが出てきてよく分からず色々調べていたのだけど…

月次目標のおすすめ

はじめに 今回は大した記事じゃないんですが,月単位の目標を予め月初以前に作っていたらなかなか良かったという話です. もともとはRebuild.fmによく出てるhigeponさんが,何らかの目標を毎月立てて,あとで振り返りをしてるという話を聞いたことからなんで…

2018年に買ってよかったもの(日用品とガジェット)

今年も色々なことがあり,いろいろ言い訳を立てて色々買いました.今年買ってよかったものを振り返ります. 日用品 折りたたみ傘 90gとアホみたいに軽いです.2回ほど使いましたが問題なく使えます.常に持ち歩きもできるレベルの軽さなので重宝しています.…

arXiv論文のためのChrome拡張を作った

皆さんはarXivの論文を読んでまとめようとするとき,どうやってその論文情報をEvernoteなりOneNoteなりに書いていますか?私はいちいちコピペしていたのですが,arXivは更新頻度が高いので面倒だなと思い,Chromeの拡張を作って単純作業は自動化しました. …

一人語りのポッドキャスト.良い音作りのために必要な作業.

おかげさまでポッドキャストLeading NLP Ninjaの配信も約4ヶ月で16回に到達しました.テーマがニッチなのでこれだけの人に聞いて頂けるとは思ってもいませんでした.今回の記事では,私のポッドキャストの録音や編集環境について説明したいと思います.と…

NLPの論文を解説するポッドキャストを始めた

先月からNLP(Natural Language Processing),自然言語処理に関する最近の論文を紹介するポッドキャストをはじめました. Leading NLP Ninja • A podcast on Anchor 経緯 私はポッドキャストが好きで,特にテック系のポッドキャストをよく聞いていました.…

カーネギーメロン大学で客員研究員してきた話

2017年8月から2018年9月の頭まで,約1年間,Carnegie Mellon University (CMU)のLanguage Technologies Institute (LTI)で客員研究員をしてきた.博士号も持っておらず,大学では別の研究としていた私が,どのような留学してきたが,記憶が新鮮な…

pudbで機械学習開発を加速させる

皆さん,pythonで機械学習のコードを書くときに,どのような環境で実装してますか?私は師匠もおらず,自分なりにいろいろ試していたところpudbに落ち着きました.pudbはデバッガーでpdbにUIが付いたようなものになります.pdbはC++でいうgdbみたいなもんで…

Fitbitのアプリ開発環境がイケてる件について

Fitbit フィットビット スマートウォッチ Versa 心拍数測定 睡眠 パーソナルコーチ 耐水仕様 Black/Black Aluminium L/Sサイズ【日本正規品】 FB505GMBK-CJK出版社/メーカー: Fitbit発売日: 2018/06/15メディア: エレクトロニクスこの商品を含むブログを見る…

機械学習における実践ログTips

機械学習(深層学習)の開発では,一般的なプログラミングでの開発とは異なり,実行から結果の確認までのフィードバックまでの時間がとても長いです.機械学習初心者の私はその違いをあまり深く認識しておらず,当初はその特性の違いで困っていました.失敗…

あるサブディレクトリ内の最新のファイルを一発で開く方法

大量のログファイルとかがあるときに便利なコマンド. こんな感じ.サブディレクトリの次に*(アスタリスク)を入れると,相対パスも含めて表示してくれるのがミソ. ls -t subdir/* | head -1 | xargs lesspecoとか入れてるなら更にパイプでつなげると便利…

正規分布間のKLダイバージェンス

皆さん大好きなVariational Auto Encoderですが,目的関数に再構築ロスとKLダイバージェンスによる正則化項を使っています.原論文のAppendix Bで,正規分布間のKLダイバージェンスの導出をしていますが,途中式が省かれていてよく分かりません.ということ…

Touch Bar使ってないならApple Scriptで色々しようぜ

あなたのTouch Bar,ちゃんと使ってますか?私は全く使いきれず,買ったことをずっと後悔していました.しかし最近BetterTouchToolを利用することで,簡単に自分好みにカスタムできることができることを知ったので共有しておきます.今の私のTouch Barの様子…

帰納バイアス (Inductive bias)

機械学習において,学習データに現れないデータを予測するためには,何らかの制約が必要となる.この制約のもと,モデルを一般化できる.この制約を帰納バイアス (Inductive bias)と呼ぶ.例えば線形回帰のinductive biasを考える.入力xと出力yは線形の関係…

Dockerでgithubのプライベートリポジトリをsshでcloneする

調べてみると色々方法があるようだったが,下記のリンクの方法が一番よかった.Dockerでcloneする用に鍵を作ってそれを利用する方法.英語読むのダリィという方のため(といいつつ自分の作業用メモ)この記事書いておきます. tarunlalwani.com Dockerでclon…

海外からLightsailで日本国内にプロキシサーバーを立てる

私的利用のために必要になったので,書いておきます.日本国内(あるいは海外)にプロキシサーバーを自前で建てようとした場合,VPSの契約などが必要になると思います.そこで以前にもお世話になった某サイトでサーバーを借りようとした所,リソースが余って…

Chrome extensionでarXivの情報をコピーする

chrome.google.comarXivのページを見てる時に,私はメモとしてタイトル,筆者,URLをコピーして,Evernoteとかにまとめてたりするんですが,量が多いとそのコピー作業が面倒です(2回コピーしないといけないので).ということで,久しぶりにChrome extensi…

Visual Studio CodeでIntegrated/ExternalのTerminal/Consoleを使う

`launch.json`に書けば良い.pythonで`input`によるテキスト入力を受けたい時に,デバッグコンソールでは入力できないことに気づきこの設定を探した. VS Code内のIntegrated Terminalで実行したい場合 "console": "integratedTerminal" VS Code外のTerminal…

HHKB proからErgodoxに乗り換えた話

巷で話題のErgodoxに乗り換えてみました.というのも最近猫背で肩こりがひどいし,血行が悪いせいか目の疲れもひどいのです.これまで使っていたのはHHKB proのUS配列のものです.タイピングは最高ですが,やっぱり手を中心にもってくるためどうしても肩が丸…

OSXでPython2系と3系を運用する

利用しているライブラリでPython2のみ対応だったのでPython3だけでなくPython2も動くように変更した.ググったらすぐ見つかったけど,メモしておく. $ conda create -n python2 python=2.7 anaconda $ source activate python2 // PATHに反映させたい場合 $…

AutoHotKeyでVisual Studio Codeを起動してる状態でChromeのみにキーバインドを有効にさせたいとき

複雑なタイトルですが,AutoHotkeyでChromeのみに割り当てていたコマンドがVisual Studio Codeにも有効になってしまっていて混乱しました,という話.AutoHotkeyのWindow SpyでVisual Studio Codeを見てみるとこんな感じ.そう,Chrome_WidgetWin_1になるん…

macos Sierraでのキーコンフィグあれこれ

SierraにするとKarabinerが基本使えず,Karabiner-Elementsというキーの置き換えしかできないけど,いろいろ対応策記事が出てたんで思い切ってやってみた.環境はEarly 2015,USキーボード,macOS Sierra 10.12です.karabinerの設定(el capitan時代)はこ…

MacBook Pro用のフリップスタンドのBluelounge Kickflipがめちゃくちゃいい

Bluelounge Kickflip MacBook Pro用フリップスタンド 13インチ ブラック BLD-KF13-BK出版社/メーカー: BlueLounge発売日: 2014/07/15メディア: Personal Computersこの商品を含むブログ (4件) を見る年始に買ったMBP用のBluelounge Kickflipがとてもいいです…

Ubuntu on WindowsでOpenAI/Gymを動かす

下記の方のセットアップでUbuntu on WindowsでOpenAI/Gymを動かしてみましたが,CartPoleはできたけど,Pongなどのatariのゲームが動かなかった. qiita.com 環境 python 3.5.2 :: Anaconda 4.2.0 (64-bit) エラーと対策 gym[atari]を入れようとするとエラー…

OpenAI GymでQ学習してみた

今更ながらOpenAI Gymに手を出してみました.OpenAI Gymは強化学習の検証プラットフォームです.色々なゲームがGymとしてあるので,自分のアルゴリズムを簡単に検証できます.以前最良経路をQ学習で求める記事を書きましたが,Gym向けに書けばGUIも付いてき…