総合コミュニケーション科学
実施場所
- 1週目のみ西5-602
- 2週目以降は西5-309
お題
「KNIME」
現状
- あまり日本語での情報が多くない
- 手ほどきのコンテンツがない
目標
- インストール、データマイニング手順に関して、例題つきのコンテンツを用意してあげよう。(PDFとウェブで)
スケジュール
回 | 月/日 | 項目 | 内容 | 制作 |
1 | 11/27 | ガイダンス | 課題の説明 | なし |
2 | 12/04 | 初めてのKNIME | インストールとデータの読み込みと何かを動かしてみるところまで | 手引き |
3 | 01/15 | 手引きのレビュー、二回目のKNIME | 少しデータマイニング | 手引きの改訂版とルポ |
4 | 01/22 | ルポのレビュー | ルポの改訂版 | |
5 | 01/29 | 予備 | 予備 |
コンテンツ準備上の注意
画面のコピーは[SHIFT]+[PRT SCRN]で撮影して、WordやPowerPointに貼っていくのが楽だが、今回はドキュメントとウェブコンテンツを作成したいので、ペイントやGIMPを使って、まずはJPGかPNGで保管してほしい。
内容
一週目
ガイダンス(のみ)
二週目
KNIMEのインストールと使用法
課題:手引き作成(年内提出)
三週目
KNIMEでデータマイニングしてみる
- 定期預金獲得のためのテレマーケティングデータを使う
- 決定木 (decision tree)
- RandomForestを使ってもらおうとしたけど、準備しかできなかった
- ニューラルネットワークも試したけど、入力ノードが連続変数である必要があったのでやめた
課題:KNIMEで決定木分析をしてみる
- ワークフローをつくる(前回課題と同じなので省略)
- とりあえず決定木分析をするにはどうすればいいか(ノードを選んでワークフローに投げ込んで実行する手順)
- とりあえず出てきた出力を読む(あまり営業戦略に活用できない決定木が出てきたけど、とりあえず読む)
- 役に立たない変数での分割は不要なので、解析から取り除くにはどうすればいいか(ノードの設定を変更して、変数を除去する)
- また出てきた出力を検討する
- 以下、この手順を繰り返すと、役に立つ決定木にたどり着ける(かもしれない)
四週目
前回はもしかしたら、レポートとして作成してくださっているかもしれません。 一番最初の回にガイダンスで説明したように、KNIMEを使ってもらいましょう、という手引き、案内が狙いです。 だから、理論はあまりどうでもよくて、結果もあまりどうでもよくて、簡単ですよ、とか、とりあえずやってみませんか、とかそういうニュアンスを醸し出してください。
課題:目的を微調整して、決定木分析をするのにKNIMEを使ってみましょう、にしてください。
- インストールとデータの読み込みは説明しなくていいです。それは最初の課題のカバー範囲です。
- 決定木とは何かは説明しなくていいです。決定木をKNIMEでやってみたくなる人は、決定木が何かを知っています。
- 細かいオプションも説明しなくていいです。基準なども、使いたくなる人は知っていますし、使う人が調べればいいです。
- 変数を解析に加えたり除いたりする手順は必須です。これがデータマイニングのプロセスの主要な部分のひとつです。
- 「役に立つ変数」「役に立たない変数」の説明は少しお願いします。
出席者が八人だったので、二人一組での取り組みをお願いしましたが、一人いなくなってしまったので、七人になりました? 三組は二人の今日までに提出の課題を比較して、使えるところを採用し、補えるところは補ってマージしてください。 一組(一人)は、私に相談してくれたように、優しいインストラクションに改訂してください。
提出物は、成果物としてのドキュメントファイル(マイクロソフトオフィスのファイルかPDFがいいです)をお願いします。 ペアを組めた方々は、ペアで1ファイルを送ってくださっても、個別に1ファイルずつ送っていただいても構いませんが、 ペアの名前を一番最初に記してください。 学期末が近くて忙しいとは思いますが、PBLの成績報告の期限もどこかに設定されているはずですので、提出期限は来週中でお願いします。 多くの作業は今日の時間中に終わると思いますが、念のため1週間の余裕を見ます。