- 追加された行はこの色です。
- 削除された行はこの色です。
*目次 [#b8c157d0]
#contents
*人工知能開発をしたい方に、テーマとデータをゲットするいい方法 [#u601a777]
人工知能って何やったらいいのか、テーマが思いつかない方
Kaggleというコンペしってますか?
いろいろなお題目がだされ、世界中のチームがエントリーしてるサイトで
https://www.kaggle.com/
※↑ 2017年にGoogleが買収しました。
**メリット [#m4191dc2]
メリットは生のデータを使えるということで、これを使って実際に使えるAIの開発に役立たせることができます。
**流れ [#z7b4f9e7]
-Kaggle Accountを作成しSign inする
-参加したいCompetitionを決めDataset等をDownloadする
-Competitionで計算すべき内容を理解する
-Datasetを処理しSubmit用Dataを作成する
-Submitして順位とScoreを確定させる
***くわしくはこちら [#w4ea143f]
http://qiita.com/taka4sato/items/802c494fdebeaa7f43b7
*始め方(英語)How to enjoy Kaggle? (including beginner) [#q53816ad]
https://www.quora.com/How-do-I-start-doing-Kaggle-competitions
https://www.quora.com/What-Kaggle-competitions-should-a-beginner-start-with-1
https://www.quora.com/session/Ben-Hamner/1
*いろいろなサイト [#w61120c2]
**日本語チュートリアル Kaggle入門 [#g36ecfe5]
http://qiita.com/taka4sato/items/802c494fdebeaa7f43b7
**Titanicチャレンジ(英語) というコンペ [#w09ae3ac]
タイタニックの動画をテーマに、
バイナリ分類と、Python(pandasとか)とR言語の練習をする
https://www.kaggle.com/c/titanic
***予測する内容 [#v69a047a]
どのような性質を持った人々が生存する傾向にあるかについて機械学習のツールを使って分析を行います
***ルール [#c4bc7d5f]
ランダムフォレストを使って予測
***評価方法について [#j01acae4]
-データは"training set"と"test set"の2つに分かれています。
"training set"に対しては各々の乗客に対する結果(ground truth)を提供します。
この訓練セットはテストセットに対する予測を行うためのモデル作成に利用可能にする。
-テストセットの各々の乗客に対し、沈没に際し生存したかどうかを予測
0が死亡を表し,1が生存を表します。
正しく予測できた割合がスコア。
***データセット [#b5947101]
https://www.kaggle.com/c/titanic/data
**Titanicチャレンジのサイト [#j9fda29c]
***Titanicチャレンジ攻略法 [#e9a55383]
http://qiita.com/suzumi/items/8ce18bc90c942663d1e6
***kaggle初挑戦: タイタニック乗客のプロフィールから生存率をランダムフォレストで予測してみた [#y887aa94]
http://shinya131-note.hatenablog.jp/entry/2015/07/12/153538
***kaggle2回目 タイタニック号の生存者予測 [#e88b5325]
http://ksknw.hatenablog.com/entry/2015/11/29/181523
***機械学習によるタイタニック号の生存者予測 [#b67030bc]
http://tanajun99.hatenablog.com/entry/2015/06/24/020007