decadence

個人のメモ帳

ScalaNLPでPageRankを計算する

Scalaでも科学計算が頑張れば出来るかもしれないScalaNLPを使ってPageRankを計算してみる 以前はScalalaって名前だったものnumpyとのチートシートもある ちなみにpython分からないから意味が無い.ひとまず今回は小さいサイズでやってみる. リンク構造は以…

ScalaでNaverまとめ画像スクレイピング

最近はNAVER まとめ[情報をデザインする。キュレーションプラットフォーム]のおかげで,画像閲覧も楽しくなってきました.Scalaでscalax.ioやJsoupを使ってます. Build.scalaも置いたのでsbtでほほいと実行してくださいNaverまとめの特定ページから元の画像…

Slick 1.0.0 documentation 日本語訳

Slick使ってますか?というわけでSlick 1.0.0 Documentationを勝手に翻訳した 問題等指摘された場合には,すぐに消します.SlickはTypesafe社によって開発が行われている,Scalaのためのモダンなデータベースラッパーである. データベースにアクセスしなが…

Mallet Infer-topics

Malletを用いたトピック推論Mallet TopicModeling - krrrr.comの続き 上記で作成した,tutorial.mallet,tutorial.inferencerを用いて,新しい文書のトピックを推論する1からの順序を述べると mallet形式の教師データ作成 トピックモデル構築 tutorial.malle…

Mallet Data Import in Japanese

日本語の文書をmalletのデータ形式にimportする特に,Mecab(cmecab)を用いて名詞のみを対象としたデータのインポートを行った 英語ならば,公式にあるものをそのまま用いれば良いコマンドラインからでは名詞抽出を行うには別途抽出を行ったファイルを作成し…

Mallet TopicModeling

Mallet is MAchine Learning for LanguagE ToolkitMALLETはstatistical NLP, Document Classification, クラスタリング,トピックモデリング,情報抽出,及びその他のテキスト向け機会学習アプリケーションを行うためのJavaツール 特にLDAなどを含めたトピッ…

Mecab dictionary, with cmecab-java

utf-8で動くようなユーザ固有辞書を作成し,cmecab-javaで用いるmakedic.rbは転用 適当な日付表現等抜けたら十分 文字コードが...Macportで入れたMecab 辞書は同じくMacportで入れたipadic-utf8を利用 #!/bin/sh wget http://d.hatena.ne.jp/images/keyword/…

Bag-of-words,LDA事始め

日本語テキストからBag-of-words,コーパスを作成する 特に,UCL MLのBag of Words Data Setと同じ形式を出力https://gist.github.com/krrrr38/5082368LDA写経 + なんちゃってScala 元はこちらhttps://gist.github.com/krrrr38/5082403

Slick in Play2.1

Slickを使ってみたドキュメントとSlick ガイド - tototoshiの日記が参考になった基本的な使い方は上記を参考に.以下の点について軽く SlickをPlayで使う 上記ガイドなどから見つけにくかったSlickに関する適当な事 環境 ・Scala 2.10.0 ・Play 2.1.0-RC2 ・…

さくらVPSを借りた

サーバいろいろいじりたくてvpsを借りた 今までアルバイトや研究室でちょこちょこ触る程度だったから自分の物を持つ事が出来て嬉しい.ここで動いてる.やった事 apache, firewall, ssh, virtual host等の設定(初めての事が多くて楽しかった) Play!動かした(…

最近(?)読んだ本

14章からの実演リファクタリング良かったClean Code アジャイルソフトウェア達人の技作者: Robert C. Martin,花井志生出版社/メーカー: アスキー・メディアワークス発売日: 2009/05/28メディア: 大型本購入: 27人 クリック: 914回この商品を含むブログ (80件…

play!2.0 WSを使ってRSS取得

Play!を使って何か作りたかったので,個人のHPを作成した. 結果はこんな感じ.これはherokuで動いてる. 少しかじったjsを10行ぐらい入れて少しだけ動的にした. 1日で適当にやったわりにはまぁまぁの見た目の物が出来た.さすがBootstrap.特にすごい!と…

Functional Programming Principles in Scala

Functional Programming Principles in Scala気がついたらCertificationが発行されていた. どこにリンクがあったんだろう... リンク : Course Records | Coursera I earned 98.3% in Functional Programming Principles in Scala on @Coursera! URL #progfu…

Play authentication template

Play authentication template Playの中にユーザ認証を行う機能がついたzentasksというScala Sampleがある そこから本当に認証の部分を取り出しただけのもの ついでにAction not found的なエラーのページもGlobal.scalaをいじる事でつけた play_applications…

聞々ハヤえもんの代わり

Mac

Macでの音楽のpitchシフト再生についてWindowsを使う理由が聞々ハヤえもんのためだけになっているため,この使用用途をMacで代替するための検討 必要条件 1オクターブのpitchシフトが行える 再生速度の変更 (範囲指定再生機能) 結論:Audacityを使う 成功: …

2012年サマーインターン

2012年夏インターンに2つ参加してきました. 行って来た所は,NHN Japan様とYahoo! JAPAN様. 日程順で書いただけであり,比較などは全くしません.そもそも双方とも面白くて比較出来ん... 先に言いたい事を言うとこんな感じ 大学院進学予定な5回生でもイン…

シェル操作課題 (cut, sort, uniq などで集計を行う)

はてなブックマークに置いといて全く手つけずに放置してた 時間があるし手出した シェル操作課題 (cut, sort, uniq などで集計を行う) 設問編 - Yamashiro0217の日記awk -F で区切りを指定sort -k POS1[,POS2] : POS1からPOS2でソート 追加オプション n : 数…

Tips08(R, mysql, 時系列モデル)

Rによる階層的クラスタリング > di <- iris[,1:4] : 特徴量 > res <- iris[,5] : 結果 > hc <- hclust(dist(di), method="ward") : 差分を取り,ward法でクラスタリング > plot(hc) > classes <- cutree(hc, 3) : デンドログラムから3つに分ける > mixtable …

第1回 関数型言語勉強会に参加した+InverseFizzBuzz

先日の土曜日に,第1回関数型言語勉強会 大阪に参加してきたScala初めてから関数型言語が身近に感じてきたのでちょっと踏み切って参加した. 学生少ない.取りあえず,全然会話せずに終わった. 無料だったし,触れた事の無い関数型言語を知れたのが良かった…

tmux, emacsで作るScala環境

以前に出来なかった環境が完成しました.想像していたものは以下のようで 結果としてこのようになりました. 背景は後日変えよう...本家ターミナルにtmuxで画面分割し,左と右上にEmacs,右下に普通のzshからREPLを呼び出しもちろん補完も出来ます.ここに至…

Tips07 (def/val, pf, call-by-name, 変位, 境界, assert)

自分用のメモ -> Tipsという名の考察とコピペdefとvalの疑問に対しては,twitterで色々紹介して頂きました. 再度,この場を借りて感謝の意を.同時刻に遅延評価について色々言及があって面白そうだった. defとvalは違う >結論 : どちらを使うとか現時点で…

giter8で自分用のtempleteを作った

以前にこんなエントリを書いたのだが,完全にgiter8の事をスルーしていた.非常に便利である.sbtを用いてscalaのコードを書いて実行したりする際に,設定ファイルやら推奨されるディレクトリの構成がある. giter8はテンプレートからローカルに雛形を作成し…

モナドは象だ

「モナドは象だ(Monads are Elephants)」日本語訳 — Japanese Translation of Monads are Elephants v1.0 documentation読み終わりました. JavaからScalaに行った人には比較的分かりやすい説明だったと思います. ちなみに4章でぎり頭爆発.ほとんど抜粋で…

ダイクストラ法

を自分なりに書いてみた疑似コード見ながらコードを書くという習慣が全く無いので,その辺にもちゃんと手をつけていこうと思う. 恐らくこのコードもすごい人から見たらエラー見つけられてしまうようなコード.でも@tailrecを使い,varを出来る限り使わない…

環境について

Scalaを書く環境について考えています. というか完成系はほぼ決まっており,以下のような形になります. 全然まだ初心者だし,REPLでの確認がしたい感じです. Terminal.appとEmacs.appを行き来するのは嫌です.ただ条件としてREPL(scala-inferior)で履歴を…

Pro Git

git

そういえばGit - Bookを読んで途中でやめていたのですが. まぁオープンソースとかはまだしも,自分で使う分ぐらいの資料まで読んでテキストとしてまとめていたので,こちらにも貼付けておこうと思います.まとめたのは1~4章分ぐらい. 続きの5章のGitでの分…

Tips06 (Scala : itpro)

刺激を求める技術者に捧げるScala講座 - 刺激を求める技術者に捧げるScala講座---目次:ITpro 適当に読み終えたし必要な所だけ取り出したなんか最初の方のコードが変なのは古いからだけじゃない気がする...一応今の時点ではまだjavaにコレクションの操作が加…

予定

刺激を求める技術者に捧げるScala講座 - 刺激を求める技術者に捧げるScala講座---目次:ITproを読み 「モナドは象だ(Monads are Elephants)」日本語訳 — Japanese Translation of Monads are Elephants v1.0 documentationを読み ((プログラミング | 形式) …

モナドのすべて

Haskell基礎文法最速マスター - think and errorを読んでから All About Monadsを流し読みした. 後半は全く分からなかったため本当に"流した",ありがたい事にScalaでモナドを説明した資料もあるので,そちらに本腰を入れて頑張って読もうと思う.

S-99 その3

S-99: Ninety-Nine Scala Problemsの続きですLogic and Codes(P46~50)も解いたので日記に書きます. メインはP50のハフマン符号化 caseクラスや継承を用いて書くコードscalaっぽさを出すためにパターンマッチ 解答例はQueueとか使ってるよく分からない... そ…