【AlphaZeroを理解する】多腕バンディット問題編

ゲームAI 機械学習

概要囲碁、将棋、チェスなどのボードゲームにおいてルール以外のドメイン知識を利用せずに対戦用AIとしてのState-of-the-art（SOTA）を達成したAlphaZeroを細かく分解しながら理解していこうというシリーズです。今回はモンテカルロ法の基礎となる多腕バン…

#ゲームAI

2023-11-06

【ゲームAI】オセロの結論が引き分けであることが解析されたらしい

ゲームAI

結論オセロの結論は引き分けということが解析されたらしい（弱解決）詳細オセロの結論は引き分けであるということを解析したという論文がArxivに投稿されていた。 arxiv.org 上記の論文を読んでみて気になったのが「解かれたゲーム」というのには ultra-w…

#ゲームAI

2023-11-03

【AlphaZeroを理解する】モンテカルロ法編

ゲームAI 機械学習確率統計

概要囲碁、将棋、チェスなどのボードゲームにおいてルール以外のドメイン知識を利用せずに対戦用AIとしてのState-of-the-art（SOTA）を達成したAlphaZeroを細かく分解しながら理解していこうというシリーズです。今回はAlphaZeroの根底にあるモンテカルロ木…

#ゲームAI

2023-10-29

【Unity】MLAgentsでターン制ゲームのAIを実装する時の行動決定方法

Unity ゲームAI 機械学習

結論 RequestDecisionメソッドを使用する詳細 Unity MLAgentsで自作ゲームのAIを実装する際に、サンプルの実装を参考にすると思いますが、サンプルゲームにはリアルタイム性の強いものが多く、ほとんどが下記の画像ようにDecisionRequesterのコンポーネント…

#Unity #ゲームAI

2023-08-02

【LLM】大規模言語モデルを動かすのに必要なGPUメモリ

ゲームAI 機械学習 LLM

結論【推論】推論時の必要GPUメモリ[GB] = パラメータ数[b] × 2 【学習】学習時の必要GPUメモリ[GB] = 推論時の必要GPUメモリ[GB] × 4 【n bit 量子化】量子化時必要GPUメモリ[GB] = 通常時必要GPUメモリ[GB] × ( n / 通常時の bit 数) 【LoRA】学習時…

#機械学習 #GPT #LLM