研究

2021.10.23

情報の山(データ)を採掘(マイニング)し、 隠れた「なぜ」を紐解いていく面白さを体験しよう

工学部 工学科 総合工学系 情報コース データマイニング研究室
 
北島 良三 助教 Ryozo Kitajima

教員プロフィール

きたじま?りょうぞう
1983年大阪府生まれ。東海大学文学部を卒業後、同360足球直播_新英体育在线¥下载官网工学研究科(修士課程)を修了。IT企業での勤務を経て、東海大学360足球直播_新英体育在线¥下载官网総合理工学研究科(博士課程)へ進学?修了。2017年成蹊大学 理工学部 助教。2019年本学工学部に着任。受賞歴:データ解析コンペティション 360足球直播_新英体育在线¥下载官网2年度 日本計算機統計学会スタディーグループにおける報告会 最優秀賞(一般部門) など。

データと向き合い、「なぜ」「どこから」を探求する

解析対象テ?ータに含まれる単語を調査している図

 当研究室では、データマイニング技術を基に特徴を抽出し、社会活動や人間行動を特に関心領域として研究を行っています。高度情報化が進み、日々膨大な量のデータが生み出される現代では、収集したデータを様々な方法で解析し価値ある情報を掘り当てる『データマイニング』が活用される場面が増えてきました。ただデータを眺めていても何も特徴は見えませんが、適切に解析をすることでその背後に隠れている特徴を抽出することができます。この特徴は貴重なもので、データ解析対象の理解にとても有益な情報となります。

 データマイニングにより、データの背後に隠れている特徴の抽出を試みる訳ですが、常に「なぜ」という気持ちをもってデータと向き合うことがとても大切なことだと思います。ときには解析の糸口が見え難いこともありますが、そのデータが記録された背景について「どのようなことがきっかけとなのか」、「なぜ」といった事に考えを巡らせて解析を行っています。

データの背後にあるものを解釈する

 データマイニングはただデータ解析を行えば終わりというものではありません。解析の結果得られた情報がなぜ?どのように解析対象に影響を及ぼしているのかなど、結果を解釈することが大切です。しかしこの解釈する作業に正解はありません。解釈は人それぞれです。ですので、解析結果を主張するには論理立てて説明し納得してもらう必要があります。

 データマイニングについてよく語られている話で、夕刻、紙おむつとビールが同時に購入される傾向がある、という有名な事例がアメリカにあります。これは、母親に代わって店に紙おむつを買いに来た父親が、自分へのご褒美としてビールを買う、と解釈されています。実際にお店がこのデータを基に商品をレイアウトした実例は確認されていませんが、ある仮説を立てて社会に還元していく上でわかりやすい解釈だと思います。

わくわくする採掘(マイニング)作業を楽しむ

 研究室では学生に『大きな視点を持ち、話(主張)の道筋をつくり、どのような解析プロセスを辿れば、相手にとって価値のある情報を届けることができるか、納得してもらえるか』をよく考えるよう教えています。繰り返しになりますが、『なぜそうなるの?』という視点もデータ解析にとても大切なことです。データに記録されているのは何かの結果です。ですのでその原点について考えてみることで、解析の糸口が見えてくることもあります。当研究室で学ぶ学生たちにもこの視点を養ってもらいたいと思っています。

 特徴抽出、また解釈は決して楽な作業ではありませんが、どの様な結果が得られるかとてもわくわくする作業でもあります。当研究室で一緒にデータの山を採掘 (データマイニング) しませんか。

※所属?職名等は取材時のものです。

情報コース

コンピュータの基礎から最先端の人工知能までを学び将来の選択肢を広げる

コンピュータを自由自在に操り、社会問題を解決できる能力を身につけます。コンピュータの基礎?専門知識の獲得にとどまらず、その知識と技能を活かして、様々な分野へ挑戦していける広い視野と応用力も養います。実習科目に加え、多彩な講義を用意しています。