どっちが先で,どっちが後か?

問い:

機械に「学習」を教えるにはどうしたらいいか? 機械に学習させる(機械学習)にはどうしたらいいか,ではない.機械学習は機械が「正解に辿り着く」やり方を教えている.そうではなく,「人の学習とはどういうものか」ということ自体を教えるにはどうしたらいいか,ということである.「人って/子どもってこんな風に学んでいくんだよ」というのを教えたい.機械学習が「人はいずれ不正解から正解に辿り着くようになる」という学習のモデルを前提にしているのだとすると,その前提自体が間違っているかもしれないよ,人間ってそうは学ばないよ,ということを教えたいということである.

部品1:

なぜ,こんなことを考えるか? 機械や人工知能(AI)には明確なメジャー(指標)が要るから,である.例えば,AIが将棋や囲碁の世界で長足の進歩を遂げたのは,「勝敗」という明確な結果のお陰で「どんな手がよいか」のメジャーが立つからである.だから,人間が定石や棋譜を教えられる.これがこう役に立つんだよ,と.あるいは,教えなくとも,AI同士で何万回と対戦し続けられる.「勝った方が採っていた手がよいのだろう」と遡って自ら学ぶことができる.それによって各時点の「手」に評価値をつけることができる.

しかし,学びにメジャーはない.学習科学がどれだけ進歩しても,私が死ぬまでに「この指標一つで決まり」というものができるはずはないだろう.それぐらい人の学びは多様で複雑なので.

だから,これまでは「これ一つで決まりだ! アクティブ・ラーニングの学習評価」みたいなシステムを紹介されるたびに,疑惑の目を向けてきた.けれど,どうも,こういう自動化をしたいという欲望はなかなか消えないようだ.

そこで,AIを使うなら何をしたいかというCoREFの,少なくとも私の考えをはっきりさせておきたい.私がやりたいのは,人の多様で複雑な学びの特徴自体を機械に教えるということである.正解だったのに不正解に戻ったり,その正解・不正解自体が軸の取り方で変わったりするということを.

部品2:

AIが学ぶには,対戦の勝敗やルンバのぶつかり合いなど「衝突」が要る.機械に学習を教えるにも,こうした明確な比較のポイント,ぶつかり合う「衝突」データが要るのではないか.

そう考えたときに,同じ問い,同じ課題に対する複数回の解答は,そのよい候補になるのではないか.知識構成型ジグソー法では,同じ問いに対する授業前後での解答を集めて,子どもの学びを捉える指標にしているが,これを機械に与えて,「どっちが授業の前だと思う?」「後だと思う?」と聞く,ということである.機械が答えを返してきたら,どっちが前だ,後だと教える必要もない.データにタイムスタンプがついているから.

こんな風に考えるようになったのは,今回が初めてだという気がする.その理由は,私自身,時間は前から後ろに進んでいくのを当然と思っていたし,その中で子どもたちに学んでほしいことが当然にあったから.だから,機械に,「前から後によくなったか」「どうよくなったか」「こういうポイントでよくなっていないか」と聞いたり教えたりするモデルになりがちだった.戦略をドラスティックに変えて,この判断を機械に任せてはどうか,と思っている.

部品3:

就学前後の子どもにいろんなタイプの積み木を釣り合わせてと頼むと,面白いことが起きる.4,5歳児がどんなタイプでもできるのに対し,6,7歳児は真ん中で釣り合わせられるタイプ以外の積み木,例えば端っこに重りがついていたり,中に重りが埋め込まれていたりするタイプができなくなる.つまりスランプに陥る.その後,8,9歳児になると,またできるようになる.

なぜか? 6,7歳児は「すべての積み木は真ん中で釣り合うべし」という自分なりの理論を作るから,である.釣り合わせ方の説明をしてもらうと,4,5歳児は何も説明しくれないのに対し,6,7歳児は「真ん中で釣り合うんだ」という説明をしてくれる.けれどその理論が現実に合わないときがあるということだ.これが8,9歳児になると「基本はそうなんだけど,重いときはちょっとこっちに寄せるの」など柔軟な理論が説明できる.

こうした同じ課題に対する,時期を違えた複数の言動のデータセットを機械に与えてみる.行動だけ見て「年を取ればできるようになる」と推定すれば,機械の予想は外れることになる.さぞ「驚く」だろう.その後,説明まで見ると,年少児より年中児の方が進んでいることに「気づく」.言動で優劣がねじれている.

こんな風に,一つの軸で見ても,人の学びは常に右上がりではないし,別の軸で見れば,そのスランプの理由が見えてきたりする.だから,人の学びを多面的にモデル化していくことを機械に迫りたい.一軸で比べて,別軸で見直して,自ら新軸を作ってほしい.「軸」が学びという現象をつくり出すことに気づいてほしい.

答え:

機械に「学習」を教えるには,同じ子どもの,同じ問いに対する,時期を違えた答えをデータセットとして与え,「どっちが先でどっちが後?」「どういう順番に並ぶ?」と聞くタスクを延々やってみられるとよいのではないか.

だからといって,機械が正確に判断できるようになって,その判断がしやすい授業ほどよい授業だという評価値を出したり,その「よさ」に授業中の子どもたちの言動がどれだけ貢献したか,近づいたかという「手」の評価値を出したりできるようになるわけではない.そんなことを望んでいるわけでもない.

そうではなくて,こうした試みが,機械にも,私たち人間にも,学びとは何かを見直す契機になるのではないかということを期待している.今まではどっちが先でどっちが後かを前提にして,その答えに優劣をつけたり,満点に照らして評価したりしがちだったが,そもそも子どもたちがどう学ぶかをゼロから捉え直すためには,こうしたタスクにも意味があるのではないかということである.

並べた後は,それをどう分析するか,どうモデル化するかという話になるので,Anzai & Simonを筆頭にした典型的人工知能研究になるだろうし,そもそもAIにどういうデータを与えるか,何をどれほど判断できるか(文章量以外の軸が立てられるのか)など,課題も山積だが,取りあえず,学習について機械が「考える」ための取り掛かりのタスクにはよいのではないか.現時点の私の考えとして,タイムスタンプつきで書き留めさせていただく.