natsuumeのblog

プログラミングの話とか趣味の話を書くかも

せっかく年が変わったのではてなブログはじめてみた

年末年始にはTwitterで来年の目標とか毎年つぶやくのが半ば恒例行事になりつつあります。

この手の目標、達成できないか1ヶ月もしたら立てた目標自体を忘れてることがほとんどですね。
とはいえ毎年目標未達のまま年末を迎えるのも良くないなぁと思ったりもしていて、せっかく年明けで切りも良かったのでその辺の管理のためにブログはじめてみることにしました。

あとTwitterに書くようなことではない内容だけど語りたい事もあったり無かったりしたので、そのへんの内容を書く場としても活用していきたいなぁという感じ。

実は過去にも何度かブログ作ったことありますが、だいたい2,3回で書くことなくなって飽きる。

継続するためのネタとして上のツイートで書いたことも含めて、今年の目標としていくつか挙げておきたいと思います。

論文たくさん読む

周りの人と比べて論文全然読んでないのを実感しているので、今年はとりあえずできるだけ色々な論文に目を通すようにしたい。
一応目標としては1日1本できれば読みたいですが、他のタスクとの兼ね合いもあるので読まなかった日の分は別の日に読むとかして、均しで1日1本くらいになればいいかなぁという感じです。

あと精読というよりはざっくり概要だけつかむ程度でOKにします。
あとで必要なときに「そういえば関連する内容の論文読んだ気がする」と思い出せる程度で。

論文は英論・日本語問わず目についたものを選ぶ予定ですが(たぶん日本語多めになるやつ)、英論の場合はアブスト、概要と結論あたりをざっと流し読みする程度でも1本にカウントします。
英論は全部に目を通すと自分の英語力では明らかに1本1日ペースで終わらなくて死ぬので……

読んだ論文の一覧とかはできるだけ定期的に(1週間に1回くらいのペースで)投稿したいと思います。

ちなみに今日読んだ論文は

文脈限定Skip-gramによる同義語獲得に関する研究

です。

ざっくり

  • 従来のSkip-gramは文脈考慮してないのが良くないから文脈考慮できるように拡張したよ
  • 周辺単語と相対位置を文脈として使ったよ
  • 各モデルでのコサイン類似度を素性としてSVMで学習して判定関数作ったよ
  • Wikipediaデータをmecabでほげほげして実験して、結果は従来のSkip-gramより良かったよ
  • 従来手法で精度が低かったカタカナ語-和語/漢語対の判定精度も向上したよ

という感じ……のはず。

とりあえず手を動かしてアウトプットする

普段は割と本とか読んで満足することが多かったのですが、最近それだとアウトプットが少ないということを(主に就活で)実感しているので今年はとりあえず色々手を動かすことを重視していきたい。

プログラミング系

インターネットの流れ的には周回遅れではあるけどデスクトップマスコット作る予定です。

題材としてデスクトップマスコットを選んだ理由はいくつかありますが

  • ニコ動とかニュースとかTwitterとかその他諸々のAPIまとめてぶっ叩いてあれこれしてくれるアプリがほしかった
  • ぶっちゃけWebまわり全然分からんしとりあえずサーバとか無しで完結するやつが現実的
  • 最近Google HomeとかAmazon Echoとか流行ってるし言語処理系の内容もくっつけられそう
  • 研究で作ってる対話システムに関して、先生と自分の目指したい方向性が微妙に違う気がして研究に対するモチベーションがちょっと下がり気味

あたりが主な理由です。

最終的にはGoogle Homeあたりのスマートスピーカー使って音声で命令できるようにする予定。
あと、研究のモチベを保つために直接的に研究の成果につながらないような内容については代わりにこっちで色々触って試したい。
こっちは性能悪化しても問題ないから色々試せるし、良さそうなら研究に逆輸入する感じで……

ちなみに、画像が東北きりたんなのは自分が東北きりたんのVOICEROIDを持ってるからです。
なので最終的には下のやつみたいなきりたんの音声でやり取りができる対話システム付きのデスクトップマスコット作成が目標になります。

すまーときりたん (Google Homeときりたんが家電を制御するよ!) - Qiita

qiita.com

www.youtube.com

ただ、ざっくり調べた感じではVOICEROIDのあれこれを直にプログラムでほげほげするのは無理そうなのでウィンドウハンドル取ってポイポイする感じになる関係で、発話生成部分に関してはちょっと検討が必要そうです。

それ以外

自分は割と興味持ったらとりあえず買ってみるタイプなのですが、そのせいで買ったけどほとんど使ってないものが色々あります。

VOICEROIDについてはとりあえずデスクトップマスコットで使う予定なのでよしとして、それ以外についてはもうちょい頻繁に使いたいなぁという感じですね。
まあCubaseは前回PC掃除した時にドングル無くしたんで動かないんですけど……。

Clip Studio Paintは色々なイラスト見るのは大好きだしノートPCもSurfaceになって液タブとしても使えるのでもうちょい頻繁に触りたい、という感じです。
なお、Surfaceの登場により今まで気が向いたときに度々引っ張り出していたintuos proのは完全に置物になりました。

本を読む

技術書、専門書の類の積み本がそろそろ2桁超えそうなので消化しないとやばい。
あと色々知識不足も感じるので(数学とか低レイヤー方面の話とか)その辺を補強したいというのもある。

とはいえ本はものによって1日で読めたり1ヶ月以上かかったりペースがまちまちなのでノルマ的なのは定めずにやっていくつもりです。

目安としては均して月1冊くらいのペースでは消化していきたいですね。
今月の分は現在帰省中で本がないので、戻ったら考えます。

あとオススメの本あったら教えてください。

就活で内定を取る

就活で内定を取る

就活で内定を取る

以上。

自分の場合、色々なタスクを併行して進めるのが人よりかなり苦手なのでさっさと就活終わらせて研究に専念したいですね。
目標としては年度内に決めたい、という感じです。

就活でここだけは譲れない、という点は

  • 額面で年収350万円以上(住宅補助とか含めて)
  • 私服勤務可
  • 面白いことができそうか

あたりですが、正直面白いと思えるかどうかは営業とかコンサル系じゃなければ、なんだかんだその時その時で楽しめるんじゃないかと思ったりもします。

強いていうならせっかく言語処理やってるし言語処理とかいわゆるA☆I系とかI☆o☆Tとか今後どんどん発展していくだろう新しい技術触ってワッショイワッショイできるところか、なんか面白そうなサービス作ってるところがいいなぁ、という感じですね。

年収は奨学金の返済が月2万ずつ降ってくる予定なので東京就職だとこの辺が最低ラインと自分の中で勝手に思ってますが、東京住んだこと無いんで実際のところどうなんですかね。
額面300以下まで行くと東京でわざわざ就職するよりも実家戻って実家近辺で仕事探したほうが金銭的に余裕ができそうだなぁ、というイメージですが。
ベンチャー系で、事業は面白そうなのに待遇で年収書いてないの割と困るのでどうにかしてほしい。

私服勤務に関しては単純に、自分が体に密着する格好だと体調を崩しやすいからです。
あと乗り物酔いがひどいのでスーツで満員電車は絶対吐く。

現状一番興味あったY社さんとp社さんからはどちらもお祈りくらってるので、今月から再始動して色々受けてみる予定です。

その他

今後も定期的に上記の内容について週1前後を目安に書いていく予定ですが、それ以外にもアニメとかゲームの話題もします。
Twitterは固定ツイートにしているやつの関係で多方面の人に観測される可能性があるというか自然言語部門の大会運営時に上のアカウントでアナウンスしてたりしたから先生含めガッツリ垢バレしてるので、趣味でがっつり語りたい内容は主にこっち中心にしていく予定。

たぶん1ヶ月もすれば書くネタが切れるので来ないと思うけど一応ネタ募集します。

peing.net

ブログネタよりも内定をくれという感じ