面白いデータを探して

適当に書く。間違えていたら教えてください。

VOICEROIDの導入に苦労した話

読み上げソフトが欲しいと思い、VOICEROIDを買ってみたものの導入に苦労してしまった話。 自分の備忘録兼、ほかに同様の症状で困っている人がいるかもしれないので書く。

unittest で Python の単体テストをする

unittest を使って Python の単体テストをする方法のメモ。

プロ野球についての考察と分析① チームの実力と相性

私の趣味は野球観戦です。 私の贔屓のチームは特定の球団にめちゃくちゃ強いです。一方で、特定の球団にはボッコボコにされていたりします。 そんな球団の「実力」とか「相性」みたいなものを分析してみたいなーという話。 正直、ちゃんとデータを集めたわけ…

ロジスティック回帰を数値微分で実装する

netres-bigdata.hatenablog.com の続きみたいな感じ。numpyと数値微分でロジスティック回帰を書いてみる。 ロジスティック回帰とか、微分した式めっちゃ簡単だから本当は数値微分をする必要はないけど。 コードもだいぶやっつけ。 コード # -*- coding:utf-8…

数値微分について

数値微分について調べてみたのでメモ代わり。 はじめに 微分の定義について 数値微分の気持ち やってみる 両側近似の気持ち 試してみる まとめ Appendix : 両側微分すると誤差が小さくなることの証明 はじめに 機械学習をしているとパラメータの更新に微分が…

オプティマイザーって重要なんだなって

研究の実験をしてて、オプティマイザーの重要性を感じる。一番ひどいデータセットでSGD auc 0.5731 F1 0.6568Adam auc 0.8959 F1 0.8816コードを1行変えただけでこんなに差が出るもんかね。

pythonのlambdaの扱いについてまとめる

今だに挙動がよくわからなくなることがあるので、pythonのlambdaの扱いについてまとめて行く。 lambdaとは 関数を定義するために使う。 例えば def inc(x): return x+1 print(inc(1)) # 2 というプログラムはlambdaを使うと print((lambda x:x+1)(1)) # 2 と…

Network Embeddingの主要な手法について2

Network Embeddingの主要な手法についてのメモ. 今回はGraRep, struc2vec, SiNE. 1はこちら. netres-bigdata.hatenablog.com GraRep LINEではfirst-orderとsecond-orderに関して最適化を行なうが,k-orderに関しても最適化を使用という論文*1. 最適化に際…

Network Embeddingの主要な手法について1

研究のためにNetwork Embeddingでよく扱われる手法についてまとめていきます. 例によって備忘録的な感じなので,主に何がしたい論文なのかに焦点を当てたいと思います.詳細に関しては論文などを見てください. 今回はDeepWalk, Node2Vec, LINE, SDNEの4つ…

数独を解いてみる

パソコンの大掃除をしていたら大学1年の時に出された課題のプログラムが出てきました。 その時の課題が「数独を解くプログラムを作りなさい」という課題だったのですが、改めてコードを読んでみるとまあ汚いし効率悪いしで散々でした。 正月で少し暇してたし…

Graph Convolutionを実装してみる

Graph Convolutional Networkを実装してみました。

tf.SparseTensorとone hot表現

tensorflowのSparseTensorとone hot表現の関係についての備忘録12/26 tf.one_hotについて追記

Q学習で迷路を解く

自分の趣味は将棋なのですが、GoogleのDeepmindが発表したAlphaZeroの棋譜を見て、自分でも試してみたいと思ったのがきっかけ。強化学習は詳しくないし、いきなりDQN(Deep Q-Network)とかよくわからないのでとりあえずQ学習やってみましょうということでやっ…

機械学習の指標いろいろ(1) 〜ROC曲線とAUC〜

機械学習の学習済みモデルの精度には色々あります。 自分でもよくわかっていない指標がときどきあるので、調べたものをまとめます。 今回はROC曲線とAUC。

tensorflowでembeddingがしたい(準備)

tensorflowを使ってembeddingがしたい機会がありました。 今回はその予習としてtensorflowのembedding_lookupのテストコードを書いてみました。 下が実行結果で、確かにパラメータの特定の列についてのみ学習ができています。

jupyter notebook 機能いろいろ

jupyter notebook上の機能についての備忘録です。

DeepWalkでニコニコ動画のタグをベクトル化してみる

前回の記事でDeepWalkの実装を試してみたので、今回はこれを使ってニコニコ動画のタグをベクトル化してみました。 netres-bigdata.hatenablog.com

文系理系どう選ぶ?

学部生時代からアルバイトで塾講師をやってきました。今は大学院生になってそれなりに忙しい生活を送っているため、ときどき人員不足のときに声がかかって、時間があればアルバイトをするという感じです。 先日もそのような形でアルバイトに行った際に、高校…

DeepWalkを実装してみた

今回はgensimのWord2Vecを実際に使用して見たかったため、実際に実装してみました。 とはいっても、word2vecそのものや、sentence2vec、doc2vecのような言語系のプログラムはいろいろな方が実装していたので、今回はDeepWalk[1]というアルゴリズムを実装して…

オートエンコーダーを実装してみた

tensorflowの練習としてautoencoderを実装してみた。

Tensorflow難しい

今までkerasとchainerに頼ってきたから、そろそろtensorflowもやってみようかと思ったけど、ちょっと難しいというか慣れない。 公式のチュートリアルとかはやってみたけど、何かいい導入はないだろうか、、、

Adversarial Learningってなんだ

最近ホットらしいけどよくわからないAdversarial Learning(日本語だと「敵対的学習」とか「敵対性学習」とか呼ばれるらしい)についてわかったことをまとめる。 今回はGAN[1]について。 最適化手法、パラメータのアップデートなんかについては後日追記予定。