Observando o comportamento do algoritmo Proximal Policy Optimization no ambiente de Flappy Bird
Resumo
Os video games se tornaram grande parte da cultura popular no mundo desde sua popularização, assim como os avanços em Inteligência Artificial. Neste trabalho, exploramos a utilização do algoritmo Proximal Policy Optimization (PPO) em um jogo. Avaliamos como o algoritmo se comporta e seu seus resultados aplicados no jogo Flappy Bird. Executamos diversos experimentos e analisamos a pontuação no jogo como métrica de desempenho. Com esses resultados, foi possível estabelecer um entendimento melhor sobre o algoritmo e como ele se comporta no ambiente de Flappy Bird.