XGBoost の lambda について

XGBoost のパラメタ lambda に関する実験を行いました。 学習データサイズを変えながら lambda の最適値を調べています。今回使うデータはUCI Machine Learning Repository: Covertype Data Setです。 データ数 特徴数 タスク クラス数 581012 54 多値分類 7…

Kaggle のランキング

2015/5/13 にランキングシステムが変更された。新旧ポイント計算式A: チームメンバー数 B: 順位 C: 参加チーム数 D: min(コンペ終了からの期間(年), 2) t: コンペ終了からの期間(日)新 旧 詳しくは以下を参照 ランキングの定義 https://www.kaggle.com/wi…

Windows 7 でAnaconda(Python+いろいろ)、Theano、pylearn2のインストール(32bit)

Anaconda http://continuum.io/downloads から Windows 32-bitをダウンロードしてインストール 自分がDLしたバージョンは1.9.1Theano コマンドラインで pip install theano もし UnicodeDecodeError が出た場合 IPython Notebook を起動しようとして Unicode…

IPython Notebook を起動しようとして UnicodeDecodeError が出た場合

Lib/mimetypes.py のtry: ctype = ctype.encode(default_encoding) # omit in 3.x! except UnicodeEncodeError: passを削除する。 出典 python - UnicodeDecodeError : 'ascii' codec can't decode byte 0xe0 in position 0: ordinal not in range(128) - St…

今まで参加した予測コンペの結果

id:tks (AusDMのみtkstks) AusDM 2009 Analytic Challenge 開催期間:2009/9/26-2009/11/22 順位:10/19 RSCTC 2010 Discovery Challenge. Basic Track 2009/12/1-2010/2/28 39/96 RSCTC 2010 Discovery Challenge. Advanced Track 2009/12/1-2010/2/28 1…

「コンテンツ販売サービスの会員離脱予測」メモ

順位は4位使用言語はR特徴抽出 アクション頻度、Bigram(頻度が高いもの200個) アクション数 アクション間隔最大 アクション間隔平均 年(POSIXlt の year属性) 月(mon+1) 1-12 日(mday+1) 1-31 曜日(wday) 0-6 時間(hour) 0-23 1月1日からの日数(yday+1) 1-…