Estudo sobre multi-armed bandits

Diogo Cardoso Fernandes
Mario Henrique Adaniya

Resumo

Este trabalho analisa as classificações do algoritmo multi-Armed bandits (MAB) e os seus campos de aplicação, por ser um algoritmo genérico o MAB tem diversas aplicações atuais. Um algoritmo MAB refere-se à uma subclasse do aprendizado por reforço onde o algoritmo, tem um agente que segue um processo sequencial de decisão em que procura otimizar suas ações enquanto melhora seu conhecimento sobre as opções disponíveis no ambiente. Sendo estas aplicações de problema bandidos encontradas em várias áreas de pesquisa envolvendo desde sistemas de recomendações, teste clínicos, problemas de roteamento em redes cognitivas, pesquisa operacional, economia e estatística. O objetivo deste trabalho é realizar um estudo dos problemas bandidos e suas diferentes configurações, e encontrar na literatura quais passos serão abordados em trabalhos futuros.

Biografia do Autor

Diogo Cardoso Fernandes

Graduando do Curso de Ciência da Computação do Centro Universitário Filadélfia - UniFil. fdiogoc@edu.unifil.br

Mario Henrique Adaniya

Orientador: Professor Mario Henrique Adaniya do Curso de Ciência da Computação do Centro Universitário Filadélfia - UniFil. mario.adaniya@unifil.br

Publicado

2023-02-16

Como Citar

Fernandes, D., & Adaniya, M. (2023). Estudo sobre multi-armed bandits. Revista Terra & Cultura: Cadernos De Ensino E Pesquisa, 39(especial), 18-27. Recuperado de http://periodicos.unifil.br/index.php/Revistateste/article/view/2799/2560

Fomatos de Citação

Edição

v. 39 n. especial (2023): Computação

Seção

Artigos