Fundamentos de alinhamento da IA: Um guia prático para começar rapidamente
Compreender o Problema Fundamental: Intenções Não Alinhadas
O alinhamento da inteligência artificial (AI) é o campo dedicado a garantir que os sistemas de AI avançados ajam de acordo com os valores humanos e os objetivos previstos. Não se trata de tornar a AI “gentil” ou “educada”, mas de projetar fundamentalmente sistemas que perseguem de maneira confiável os objetivos que nós lhes damos, sem efeitos colaterais catastróficos indesejados.