-- Views
March 24, 26
スライド概要
横浜国立大学公認プログラミングサークル Lumos LT会 における講演資料.
2026年3月24日(火) @横浜国立大学中央図書館メディアホール で開催.
機械学習との出会い そしてこれから 坪井 一馬 2026年3月24日(火) Lumos LT会 @横浜国立大学中央図書館メディアホール
[自己紹介] 坪井 一馬 2 • 2004年12月18日生まれ (21歳) • さいたま市生まれ, 川崎市育ち, 川崎市の実家暮らし • 理工学部 化学EP 3年 • POCLAB (物理有機化学・分子設計研究室) 所属 • ケモインフォマティクスの研究をしています • 私立 横浜創英高等学校 卒業 ディジタル名刺 各種SNSリンク • 中学時代はパソコン部部長, 高校時代は部活所属なし • INTP 論理学者 • 別サークルにてテレビ番組制作リーダーの経験あり • 完成した番組は実際にケーブルテレビで放送される. • 趣味: 旅行/コーヒー/酒/ゲーム/ラーメン/激辛/ご当地グル メ/名古屋メシ/喫茶店の雰囲気/離島でゆっくり流れる時間 を過ごす
ケモインフォマティクスとは? 化学と情報科学の融合領域 Chemo informatics 化学 情報科学 何を扱うの?「化学的な情報」すべて H N 原子 3 • 情報科学の技術で化学の課題を解決する • 化学の視点から情報科学を見直す マルチモーダル 集合 O HN O 分子・化合物 化学的な情報は? 結晶 高次的な構造 • 結合様式, 物性値, 反応性, 顕微鏡で見る表面の微細な構造等… • 数値, 画像, 映像, スペクトル, 記号列, 文章等, 多様な形式で表現
坪井の研究をざっくりいうと 4 情報科学の技術 で 化学の課題 を解決する 自然言語処理 分子設計, 物性予測 情報源 論文, 特許, データベース等 化学的な問い 分子の化学的な構造 原子どうしのつながり方 H N 論文数は年々増大. 人手ではすべて網羅できない. • 色素として使えそうな 分子の構造は? • 物性予測 O … with a lone hydroxyl group on the B ring has a strongly suppressive influence on the antioxidant activity. • 分子設計 • この構造の分子に毒性 はあるか? HN O 60 存在しうる構造は10 以上. 現状では109程度まで発見. • どの部分構造が毒性に 寄与するのか? 膨大な化学空間を 効率的に探索しよう! • 研究はある種の競争であるため, 論文化されるまでは詳細を話すことはできません.
なぜこんな研究をしているのか? 2023年3月 • 次世代電池開発に興味があって化学系学科を志望して受験 • 第3志望の横浜国立大学に後期合格 2023年10月 • ケモインフォマティクスに関する演習講義を受講 • 膨大な化学空間を効率的に探索しようとするアプローチの 面白さと将来性を実感 2024年度 • 理工学部共通の「DS実践基礎」と「AI実践基礎」受講 • 機械学習やデータサイエンスって何となく面白そう • 必修の化学実験を通して, 自分の手際の悪さを実感する 5 機械学習を知らない ChatGPTのことは毛嫌い 機械学習と出会う そんな技術があったのか! 座学の成績は高い 実験室で白衣でやる実験は 自分に向いていない?
なぜこんな研究をしているのか? 6 2025年度 • 何度もSNS広告を見て「なんだか面白そうだな」と思い, 東大松尾研の講座受講開始. • まずはGCI講座と, AI起業サマープログラム. いずれも修了できて思い出に残る. GCI修了式に当選! 松尾先生と写真撮影
なぜこんな研究をしているのか? 7 2025年度 • 他におすすめされた講座も面白そうだったので色々受講してしまう. レベル高いものも… Deep Learning 基礎講座 2025 修了 課題コンペティションで 約1400人中24位の経験有 深層強化学習 2025 修了 最終課題で分子生成モデル開発 発表は明瞭であると高評価 大規模言語モデル 基礎編 修了 世界モデル講座 最終課題の発表 LLMをより専門的に学ぶ 応用編も修了見込み 京都大, 慶應の学生と研究 東大で人生初ポスター発表 ソニー, NECの方と議論
なぜこんな研究をしているのか? 2025年度 • 第1志望の研究室配属直後から「自然言語処理チームで研究したい」と希望し続ける. • 松尾研講座の受講経験がチームの先輩に伝わって「坪井くんにはLLM関連のレベルが高い 研究をやってもらおうか」ということになる. • うまくいかないなかで, 試しにやったことが意外にうまくいった. • ことし夏に仙台で開催の「言語処理若手の会」通称 YANS2026 で学会発表デビュー? まず1歩踏み出すことが大事! 機械学習は難しいけど面白い! 研究室HPの研究紹介: 坪井が執筆 最初はうまくいかなくても慣れなくても大丈夫. 松尾研講座の受講で自分の人生が変わった. 単に知識がついただけではないと思う. 8
AI時代になって 完全なAI生成論文が 人工知能国際会議で査読通過 9 • もう研究はしなくてもいいか. • 卒論提出期限1週間前にAIを動かそう! • コ●タイムに縛られる意味はあるのか. • ペッパーくんみたいな高性能ロボが, 白衣を着て 丁寧に実験してくれるならそれでいいのか. • なぜ人間は危険を冒してまで自分で合成実験を やらなければならないのか. • 人間がやらないと悪いのはなぜか. • AIがやったものと人間がやったもので区別がで きないのでは. • もし「冤罪」があったらどうするのか. • 逆にどこまでAIに任せて良いとされるか. - GitHubリポジトリはこちら - 解説記事はこちら そもそも人間がやる価値とは何か. そしてこれから何が大事なのだろうか.
言語処理学会を見学してきました 日程 場所 10 2026年3月9日(月) - 3月13日(金) • 都合で3月9日(月)は不参加 ライトキューブ宇都宮 • 栃木県宇都宮市 • JR宇都宮駅から徒歩2分(東口側) 関連リンク • 公式ホームページのトップ • 大会プログラムと予稿集 • 同じ研究室で日々お世話になっているD2の先輩に誘われて, 2026年3月9日(月)〜3月13日(金)の5日間 にわたって栃木県の宇都宮で行われた「言語処理学会第32回年次大会(NLP2026)」を4日間見学・聴 講してきました(発表はしていません) • 5日目のワークショップ「気軽に国際会議を目指しましょう」における5人の著名な先生方のトーク セッションが印象的だったので, こちらでご紹介します.
言語処理学会2026のワークショップにて パネルディスカッション 11 パネラー: 岡崎 直観(東京科学大), 鈴木 潤(東北大), 村脇 有吾(京都大), 坂口 慶祐(東北大), 高瀬 翔(サイバーエージェント) • AI時代の国際会議 • サーベイ, 査読や翻訳に使われており, 効率が上がっている. 調べ物に使うのは自分で探すよりも効率的. 英語 のプレゼンも楽になった. ディスカッションピリオドも使って, AIと壁打ちしながら考えることは増えている. • 他方で, 人間の思考が皆同じになってしまう問題. 英語やプログラミングをやるモチベーションがなくなるので, 自分で問題を見つけて解決する訓練を継続して, 自分でしか実現できない目標を持つのが大事. • 研究者としてはどういったことをやるべきか考えるのが重要. • AIで論文作成支援ができるから投稿数は増える. 計算機を使って長い論文を書き, それをAIがレビューする形式 は本当に良いのか考えるべきで, 論文という形式である必要がない. そんなのはエクステンドアブストやスライ ドでいい. 色々な人と議論すること自体が重要なので, 論文という仕様に囚われすぎている. • 発表ビデオがあって内容がわかると査読しやすい. ビデオで投稿するとかあってもいいんじゃないか. • 昔は論文は手書きだったが今ではPCでやってて問題視されない. 使える技術はどんどん使えばいい. 本質的に は中身が評価されるべきだが, それをアウトプットするには何らかの形式が必要で, そのために論文を書いてい たが, そこをビデオで置き換えてもいい. 研究の本質がより評価されやすくなるとすれば良いこと. 明らかに自 分がやったことと関係ないものを出してしまうから問題になっているので, それを規制できれば良い時代に なっているのでは.
言語処理学会2026のワークショップにて パネルディスカッション • 質疑 12 技術の進歩で問い直される 結局, 何が大事だったのだろうか? • SWEは不要になっているが, 再来年の言語処理学会ではB4向けの研究テーマを全部自動でやってくれる んじゃないか?数年後にそういう時代が来るとして, どうして行けばいいのか. • 使えるものは何でも使えばいいが, 研究の本質は「誰もわからないことをわからないようにする」「新たな知見を 得る」ことなので, それをどうやって生み出すのかが問われている. 本来はそこだけ評価されればいいが, 論文書く テクニックまで評価されていたので, AIの悪用を除けば良い方向に向いている. いかに新しい, 世の中の問題提起が できるかという能力が重視されている. • シニアに比べてジュニアは若い • 論文作成や修正でAIを使っていいが, アイディア出しをAIを使ってできるかはわからない. バイブコーディングす る時, 結構自然言語でちゃんと仕様を書かないとメチャクチャになる. アイディアは壁打ちを通して作ることは頑 張るしかないし, それはシニアになろうとB4だろうと大事. • 研究を始めたばかりの学生をサポートする教員ポジションは必要か? • 私は, 自分で物事を作ったり解決するのが好きだ. LLMなど大企業が作るようなものでも, どうしてできるのかを 知るために自分でやる. AIが解決してくれたとして, 自分の知的好奇心が満たされるわけではない. 他方で, 知的好 奇心を有するためのプロセスにもAIが入ってくるとするなら, 根深い問題だと思う.
そしてこれから 13 坪井なりの考え 生成AI時代になって, 要求される水準は明らかに高くなっている. その人の原体験に基づいて, アイデンティティあふれるものを創出する. • まずは「なんとなく面白そう」なものに1歩踏み出して挑戦する! • とにかくChatGPTで解決できないことに取り組む! • 大前提として, 適切な方法でのAIの使用はむしろ奨励される. • 研究として: 視野を広げる • 良い意味での意外性. 素直に面白い, インパクトのあることをやる. • 新たな学術分野の創出, 今の感覚では意外性のある分野同士の融合を進めること. H N O • サークルとして: きっかけ創出 • 意欲ある仲間と交流しながら「これって面白そうだな」に出会えるきっかけを提供. • 自分から1歩踏み出す勇気がつくようにアシスト. 最初から上手くできる人はいない. • 何が好きになるかは人生観や経験によるので, 好きになるのが機械学習でなくてもOK. HN O
P.S 言語処理学会参加報告ブログを読んでね!! • こちらのQRコード • またはここをクリック 14
新プロジェクト「2026 MLプロジェクト」計画 • 機械学習で何ができるのかに触れます. • 週1日1時間程度, Discordにおいて, 機械学習に関してレクチャーします. す ま • 問題がなければ, 事後に別途撮影した解説動画もYouTubeで一般公開予定です. し 絡 • 坪井が自作した教材を毎回提供します. • 教材はPythonのノートブックとPowerPointスライドです(スライドがない回もあります). 連 度 再 • LT会で発表を目標にします. 発表のネタにしてもらうことを想定. テーマ案も提示する. • MLに関係ない発表も大歓迎だが, もし興味あれば, ML関連で発表してほしいな… • カリキュラムは後日公開します. • 開始時期不定. • このプロジェクトでは, 適切な距離感での生成AIの使用を奨励する. 使い方も説明します. 日 後 • 機械学習ではPython言語を使うので, Pythonの基本的な操作についても説明します. • 補足資料も用意します. • 相性の問題もあるため, 別の有益なページも紹介します. 15