>100 Views
February 04, 26
スライド概要
機械学習は、データから自動的にルールやパターンを見出し、分類や予測を行うAIの中核技術です。AIの歴史は、単純な問題解決に留まった第一次、ルール化の限界に直面した第二次を経て、現在は深層学習(第三次)や生成AI(第四次)の全盛期にあります。
機械学習は経験や勘に頼らない客観的な分析を可能にし、主に以下の3つの手法に大別されます。
●教師あり学習:正解付きデータを用い、数値予測を行う「回帰」や、スパム判定等の「分類」を行います。
●教師なし学習:正解のないデータから、似た者同士をまとめる「クラスタリング」、変数を要約する「主成分分析」、相関を見出す「アソシエーション分析」などによりデータの構造を捉えます。
●強化学習:明確な正解の代わりに、一連の行動結果に対する「報酬」を与え、最適な戦略を自ら学習させます。
「③ 強化学習」は、複雑で様々な手法がありますので、省略します。興味のある方は、下記の参考を参照してください。
【参考】 ゼロからDeepまで学ぶ強化学習
https://qiita.com/icoxfog417/items/242439ecd1a477ece312
【参考】 OpenAI Gym で自前の環境をつくる
https://qiita.com/ohtaman/items/edcb3b0a2ff9d48a7def
すべてのビジネスパーソンが意思決定プロセスにデータを活用する思考を身につけるため、まずは、データサイエンスの分析を体験していきましょう。SECIモデルの最初の段階、共同化(Socialization)からはじめていきます。 下記のブログで、ここにアップしたスライド、動画を随時、公開中です。 【ブログ】https://tutorial4datascience.blogspot.com/ 【Youtubeチャンネル】https://www.youtube.com/@DataScience_for_everyone 【Kindle】そして、このブログをまとめて書籍にしました! https://amzn.to/4ryVppn https://amzn.to/4pGgFb1
4th STEP 機械学習 Section 2 機械学習とは? データサイエンス チュートリアル 1
AIの歴史 人工知能(AI)の研究は1950年代から続いているが、その過程ではブームと冬の時代が交互に訪れ、現在は第四次の ブームとして脚光を浴びている。 埼玉県DXコンソーシアム 埼玉県Ai情報サイトより データサイエンス チュートリアル 2
AIの種類 AIは、ついに特徴量を自動で設計するようになった。 特徴量設計 ルール生成 特徴量設計 ルール生成 特徴量設計 ルール生成 人間 人間 人間 自動 自動 自動 AI 機械学習 ルールベース (エキスパートシステム) 遺伝的アルゴリズム 教師あり学習 教師なし学習 強化学習 データサイエンス チュートリアル 深層学習 (ディープラーニング) 3
機械学習の種類 コンピュータがデータを読み込むことで自動的にルールやパターンを見出し、その結果を活かして分類や予測を行う仕組み全体 のことを機械学習といいます。 STEP4の対象 学習方法 種 類 ① 教師あり学習 回帰 分類 ② 教師なし学習 クラスタリング 主成分分析(PCA) 等 等 ③ 強化学習 データサイエンス チュートリアル 4
教師あり学習 学習方法 特徴を表す情報(説明変数)と正解を表す情報(目的変数)がセットになった状態のデータ を用いてコンピュータに学習させる手法 分類 回帰 回帰の主な目的は、連続する値の傾向を もとに予測を行うこと 分類の主な目的は、分析したいデータが所 属するクラス分けを予測すること 【例】 【例】 ● 過去の気温データを基にして明日の気温を予測 ● 新しい店舗を開設する際に、検討している席数、最寄 り駅からの徒歩時間、モーニングサービスの有無を考慮 しながら売上を予測 ●トッピングの数、パンの生地、直径からピザの価格を予測 ● 会員になった期間、購入品目、購入頻度から、新商品 を購入する人を予測 ● 電子メール中に含まれる単語から、スパムメールか通常 メールかを判別 ● 顧客の支払い履歴・取引情報から与信判断 データサイエンス チュートリアル 5
教師なし学習 クラスタリング 主成分分析 特徴が近い(似ている/距離が近 い)データを集めて集団に分ける分 析手法 多くの量的な説明変数の中から、 主成分と呼ばれる複数の変数を組 み合わせたものに要約する手法 【例】 ● アンケート調査にて、化粧品利用の満足度や 意向、化粧品に対する意識調査を実施した際、 意識調査の部分でグループ分けし満足度を比 較。 ● 各ブランドを特性ごとの評価値によりグループ 分けし、該当するブランド・グループの購入者 特徴を調査 アソシエーション分析 (PCA) POSレジデータ等のデータを分析し て、「もしこうだったら、このようになる (if-then)」という関係性を導く分 析方法 【例】 ● 身長と体重(二次元のデータ)から肥満度を 示すBMI(一次元のデータ)に変換 ● 野菜を評価する色や形、大きさ、味などの多く の変数を持つデータから、「色と形が似ている 野菜」や「大きさと味が関連する野菜」など、新 たな指標(主成分)から、固有値や寄与率 を使い、データの背後にある構造や傾向を探る データサイエンス チュートリアル 【例】 ● ネット通販の購買データから、商品Aを買ったら こんな商品も買っているという確率を求める。 ● 会員の属性データとレシート単位の購買データ から、男性がベビー用おむつとビールを同時に 購買している率が高いことを発見。 6
【参考】 強化学習 強化学習は教師あり学習に似ていますが、(教師による)明確な答えは提示されません。では何が提示されるかというと、「行動の 選択肢」と「報酬」になります。 開発したいAIモデル ランダムな行動をとらなかった場合の価値を計算 状態価値関数 比較 エージェント ランダムな行動 行動価値関数が高い場 合、ランダムに選ばれた行 動が正しい行動として方策 に組み込まれることになる。 行動価値関数 【例】 チェス、将棋→自動運転、フィンテック データサイエンス チュートリアル 7