(2021年度以前入学者向け科目「情報アクセスと知的処理」の対応科目)
概要
講義スライド
a を押すとスライド全ページを 1ページとして表示させることができます。
実習テキスト
- この演習で作成するシステムの全体像
- プログラミングの準備
- 2年次科目「データエンジニアリング」の内容 (復習)
以下は抜粋
- Feed (RSS/Atom) の利用
- Webサービスの利用
- Webページの利用
- 形態素解析の利用
- 感情分析
- 生成AI
- サンプルプログラム Python版
- 補足
発表会
課題・練習問題
- 課題: プログラムの構想
- どういう機能を実現するか (参考: 過去の例)
- そのためにどういう情報を利用するか
- それはどのような形式か (調査しておくこと)
- システムの構成図
- データの流れがわかるもの。システム内の処理は表現しなくてもよい。
- 形式: スライド 3枚以上(表紙は除く) (PowerPoint もしくは PDF)
- 提出先: boxの「構想」フォルダの中
- 提出期限: 6/9 授業開始時
- 期限後に修正版を提出する際にはファイル名を変えること(元のファイルを上書きしないこと)
- 内容を大きく変えたり簡略化する場合は相談すること
- 発表: 発表2分程度, 質疑応答2分程度。発表後も内容の変更は可能。
- 練習 (提出なし)
- 練習1: 単語の抽出と品詞による絞り込み
Sudachi のサンプルプログラムを参考に日本語で書かれたテキストを形態素解析し、
特定の品詞の語のみを取り出してリストに格納し、
最後にリストに含まれる語をすべて表示するプログラムを作成しましょう。
- 抽出する語の品詞は「名詞」「動詞」「形容詞」のいずれかとします。
形態素解析用辞書では品詞は階層的に定義されていますが、ここでは最上位の階層だけを指定します。
品詞は List<String> で、先頭の要素が最上位の階層です。
- 抽出した語を格納するリストには ArrayList を用いてください。
ArrayList<String> でかまいませんが、別のオブジェクトでもかまいません。
- 入力のフィードは好きなものに変更してかまいません。
- ネットワーク接続がうまくいかない人はファイル入力に変更してかまいません。
テキストファイルを BufferedReader で読み込む方法は、
「オブジェクト指向プログラミングおよび演習」の最後の講義で扱っています。
- ファイル名: TermExtractor.java
文献案内