WCalazans: junho 2023

21/06/2023

Pode um sistema de IA exibir inteligência de senso comum?

“Uma das limitações da IA pode ser caracterizada como a sua falta de inteligência de senso comum: a capacidade de raciocinar intuitivamente sobre situações e eventos cotidianos, o que requer um rico conhecimento prévio sobre como o mundo físico e social funciona”, escreveu Yejin Choi, professor da Universidade de Washington. Choi em “The Curious Case of Commonsense Intelligence”, um ensaio publica em 2022 pela Dædalus. “É trivial aos humanos, adquirir inteligência de bom senso; porém para a IA isso tem sido considerado um objetivo quase impossível, acrescentou Choi.”

O que é inteligência de senso comum?

Em uma apresentação de 2020, Choi definiu senso comum como “o nível básico de conhecimento prático e raciocínio sobre situações e eventos cotidianos que são comumente compartilhados pela maioria das pessoas”. O bom senso é essencial para os humanos “viverem e interagirem uns com os outros de maneira razoável e segura” e, para um sistema de IA, o bom senso é essencial “para entender melhor as necessidades e ações humanas”. Ela explicou ainda mais a diferença entre o raciocínio de senso comum intuitivo e o raciocínio racional analítico, discutindo a pesquisa pioneira de Daniel Kahneman, – Princeton Professor Emérito e ganhador do Prêmio Nobel de Economia de 2002, – e seu colaborador de longa data Amos Tversky, que morreu em 1996.

Em seu livro, Thinking, Fast and Slow, Kahneman explica que nossa mente é composta de dois sistemas de pensamento muito diferentes, o Sistema 1 e o Sistema 2. O Sistema 1 é a parte intuitiva, inconsciente, rápida e sem esforço da mente. Os pensamentos vêm de forma automática e muito rapidamente, sem que façamos nada para fazê-los acontecer.

O Sistema 1 normalmente funciona de forma coerente com base em suas percepções do que está acontecendo ao redor, preenchendo lacunas, usando sua vasta quantidade de conhecimento de senso comum sobre como o mundo físico funciona e como as pessoas geralmente se comportam. Nossas mentes estão constantemente desenvolvendo coisas intuitivas sempre que percebemos um evento, incluindo o que causou o evento, o que acontecerá depois, bem como as motivações e estados emocionais de qualquer pessoa envolvida no evento. Essas coisas nos ajudam a lidar com eficiência com as inúmeras situações simples que encontramos na vida cotidiana. Mas, embora nos permita agir rapidamente, as coisas simples e coerentes que o Sistema 1 apresenta podem estar erradas e nos levar a erros.

Já o Sistema 2 é a parte mais lenta, lógica, deliberada e esforçada da mente. É onde avaliamos e escolhemos entre várias opções. Mas ele também é lento e se cansa facilmente, então geralmente não invocamos o Sistema 2, a menos que seja necessário um pensamento racional rigoroso e exigente para atividades como resolver quebra-cabeças, ler e escrever artigos, resolver problemas de matemática ou fazer um teste.

O senso comum é moldado pela biologia evolutiva e pelo contexto social. Nascemos com a capacidade de aprender rapidamente e nos adaptar ao ambiente social ao nosso redor. Em “The Ultimate Learning Machines”, um ensaio do WSJ de 2019, a psicóloga da UC Berkeley, Alison Gopney, observou que, embora o treinamento de algoritmos de aprendizado profundo para reconhecer cães e gatos exija um grande número de imagens rotuladas, crianças pequenas “podem aprender isso com apenas um pequeno número de exemplos. Algumas fotos de livros de histórias podem ensiná-las não apenas sobre cães e gatos, mas também sobre onças, rinocerontes e unicórnios.”

“Um dos segredos do aprendizado das crianças é que elas constroem modelos ou teorias do mundo”, acrescentou. “Crianças pequenas podem não aprender a jogar xadrez, mas desenvolvem ideias de bom senso sobre física …, mesmo que nunca tenham visto um carro ou uma parede antes.” Um grande desafio em IA é como construir sistemas que possam pensar, aprender e entender como o mundo funciona, como uma criança de 18 meses.

A pesquisa de IA nas décadas de 1960, 70 e 80 se concentrou no desenvolvimento de representações simbólicas do mundo com estruturas de conhecimento como redes semânticas e linguagens de programação baseadas em lógica como LISP e Prolog para desenvolver sistemas de raciocínio. “Mas, apesar de seu apelo intelectual, os formalismos baseados na lógica se mostraram muito frágeis para escalar além dos problemas experimentais de brinquedos”, escreveu Choi em seu ensaio Dædalus.

Os métodos lógicos formais são mais apropriados para problemas cuja solução pode ser obtida a partir de suas premissas iniciais por meio de inferências dedutivas, como a demonstração de um teorema matemático. Mas o raciocínio intuitivo e de bom senso é bem diferente. “O objetivo do raciocínio intuitivo é antecipar e prever o que pode ser uma explicação plausível para nossas observações parciais, para que possamos ler nas entrelinhas do texto e ver além do quadro da imagem”, explicou Choi. Além disso, o raciocínio intuitivo extrai de nosso conhecimento de senso comum sobre o mundo, para preencher os espaços em branco e, portanto, é anulado, ou seja, à medida que entendemos melhor o contexto real da situação, as explicações corretas podem ser bem diferentes daquelas originalmente fornecidas por nossa intuição.

A escala é outra razão importante pela qual a lógica formal falha quando aplicada ao raciocínio intuitivo e de bom senso. “A estrutura de raciocínio, para ser útil na prática, deve estar pronta para cobrir todo o espectro de conceitos e composições de conceitos que encontramos em nossas interações físicas e sociais cotidianas com o mundo. Além disso, o mundo real está repleto de situações inéditas, que exigem geração criativa de hipóteses, novas composições de conceitos e novas descobertas de regras de raciocínio”.

Choi acrescentou que “os formalismos baseados na linguagem, apesar de sua aparente imprecisão e variabilidade, são suficientemente expressivos e robustos para abranger o vasto número de fatos e regras de senso comum sobre como o mundo funciona. Afinal, é a linguagem, e não as formas lógicas, por meio da qual os humanos adquirem conhecimento sobre o mundo.”

Os Foundation Models, como o GPT-3, são um desses formalismos baseados em linguagem. Embora baseados em tecnologias de aprendizado profundo (DL), esses modelos de linguagem grandes (LLMs) contornaram as limitações anteriores de DL, aproveitando dois avanços recentes, grande escala e aprendizado de transferência. Os modelos de fundação são treinados com mais de 10 vezes mais dados do que os modelos DL anteriores, incluindo grandes blocos de informações na Internet, bem como livros digitais, artigos, relatórios e outras mídias digitais. E, ao contrário do treinamento específico para tarefas dos sistemas de IA anteriores, o aprendizado por transferência pega o conhecimento aprendido no treinamento de uma tarefa e o aplica a tarefas diferentes, mas relacionadas.

Pouco depois que o GPT-3 foi colocado online em 2020, seus criadores na empresa de pesquisa de IA, a OpenAI descobriram que o GPT-3 não apenas poderia gerar frases e parágrafos inteiros em inglês em uma variedade de estilos, mas também desenvolveu habilidades surpreendentes em escrever software de computador, mesmo embora os dados de treinamento estivessem focados no idioma inglês, não em exemplos de código de computador. Mas, como se viu, as vastas quantidades de dados usadas em seu treinamento incluíam muitos exemplos de programação de computador acompanhados de descrições do que o código foi projetado para fazer, permitindo assim que o GPT-3 aprendesse a programar sozinho. Da mesma forma, o GPT-3 aprendeu sozinho várias outras tarefas, como gerar documentos legais.

Choi lidera o Mosaic, um projeto do Allen Institute que está construindo um protótipo baseado em linguagem de conhecimento de senso comum e sistema de raciocínio intuitivo. O protótipo não poderia ser baseado em grandes modelos de linguagem existentes, como o GPT-3, porque esses modelos são normalmente treinados para gerar a próxima palavra, frase ou parágrafo em inglês sequencialmente da esquerda para a direita, uma técnica que não funciona para modelos de senso comum.

O GPT-3 funciona muito bem para gerar texto sequencial em inglês sobre muitos tópicos e estilos em resposta a uma pergunta ou solicitação. Mas a cognição humana cotidiana está longe de ser sequencial e requer um raciocínio flexível sobre eventos que podem não ter ocorrido sequencialmente, como o raciocínio contrafactual, — que envolve a consideração de alternativas possíveis para um evento que já ocorreu, e o raciocínio abdutivo — um tipo de raciocínio que busca a conclusão mais simples e provável para uma observação.

“Embora a maior parte do nosso raciocínio seja uma forma de raciocínio abdutivo, ele é menos conhecido pela maioria das pessoas. Por exemplo, Conan Doyle, o autor do cânone de Sherlock Holmes, erroneamente escreveu que Sherlock usou o raciocínio dedutivo para resolver seus casos. Pelo contrário, a chave para resolver os mistérios de Holmes era quase sempre o raciocínio abdutivo, que requer uma dose não trivial de imaginação e raciocínio causal para gerar hipóteses explicativas que podem não parecer óbvias para os outros”.

Como parte de sua pesquisa sobre IA de senso comum, Choi e seus colegas desenvolveram uma série de sistemas inovadores baseados em linguagem como o ATOMIC, uma coleção de descrição textual de regras e fatos de senso comum sobre objetos e eventos cotidianos e novos algoritmos de inferência que podem incorporar de forma flexível a natureza não sequencial do raciocínio intuitivo.

“Embora a pesquisa demonstre novos caminhos em potencial, estamos longe de resolver a IA de senso comum”, escreveu Choi em conclusão. “Muitas questões ainda permanecem abertas, incluindo mecanismos computacionais para garantir consistência e interpretação do conhecimento e raciocínio de senso comum, integração profunda entre linguagem e percepção para raciocínio multimodal, novos paradigmas de aprendizagem para abstração e analogias e métodos avançados de aprendizagem para aprendizagem interativa e ao longo da vida de conhecimento e raciocínio”.

18/06/2023

As escolas de negócios e a estagnação salarial

Ouvi um podcast muito interessante, Are MBAs to Blame for Wage Stagnation, com o apresentador da Freakonomics Radio, Stephen Dubner e o economista do MIT Daron Acemoglu. O podcast discutiu um documento de Darem Acemoglu, Alex He e Daniel le Maire sobre o efeito MBA de um CEO nos salários dos funcionários de sua empresa, publicado no National Bureau of Economic Research (NBER).

No podcast, Acemoglu observou que, nas últimas décadas, os salários cresceram mais lentamente do que a produtividade – fato que há muito intriga os economistas. “Se você olhar para o salário real dos trabalhadores com ensino médio, ele aumentou cerca de 2,5% ao ano em termos reais entre 1945 e o final dos anos 1970 – um aumento notável. E desde 1980, vem diminuindo em termos reais a cada ano. Portanto, uma grande fração da população dos EUA está se tornando cada vez mais pobre, mesmo enquanto estamos construindo as tecnologias mais incríveis, as maiores empresas que a humanidade já viu, a economia mais avançada.”

A parcela do PIB que vai para os trabalhadores, caiu de 63% na década de 1980 para 58% em 2020 e durante essas mesmas quatro décadas, a parcela de empresas americanas administradas por um executivo com MBA ou algum outro diploma de negócios — aumentou de 25% na década de 1980, para mais de 40% em 2020. Essas duas tendências estão conectadas? A profissionalização da classe gerencial fez com que os salários dos trabalhadores caíssem? Continue a leitura para entender o contexto.

Para esclarecer essa questão, Acemoglu e seus colaboradores analisaram dados dos Estados Unidos e da Dinamarca, incluindo informações de empresas e dos trabalhadores. Eles escolheram a Dinamarca, além dos EUA, porque o país tem dados de altíssima qualidade, que permitem fazer análises que seriam mais difíceis com dados apenas dos EUA. Sua metodologia foi bem simples. Eles rastrearam os ganhos dos trabalhadores, quando há uma mudança no tipo de gerencia que lidera a empresa, ou seja: quando ela passa de um gestor de negócios, nível técnico, para um gestor com formação em negócios e vice-versa.

A descoberta principal do estudo foi que, quando um CEO sem formação em negócios é substituído por um CEO com um MBA, há um declínio significativo nos salários. Cinco anos após sua nomeação, os salários diminuem 6% e a mão-de-obra diminui 5% nos EUA, enquanto na Dinamarca, tanto os salários quanto a mão-de-obra diminuem 3%. “Em nenhum dos dois países vemos quaisquer tendências diferenciais na participação da mão-de-obra, salários, emprego, produção ou investimento antes do início do mandato dos gestores com MBA. Também não detectamos uma resposta de emprego, produção, investimento ou produtividade, o que sugere que os gestores com MBA não são mais produtivos do que seus antigos pares”.

Esses resultados respondem por 20% da queda da mão de obra e cerca de 15% da desaceleração do crescimento salarial desde 1980 nos EUA, e por 6% da queda na participação da mão de obra na Dinamarca. Além disso, a nomeação de um CEO com MBA leva a um aumento de 3% no retorno sobre os ativos (RoA) nos EUA e um aumento de 1,5% na Dinamarca; o valor de mercado das ações da empresa aumenta em cerca de 5%; e tudo mais sendo igual, os gestores com MBA ganham mais do que os gerentes de outras áreas.

O que explica as diferenças nos salários e na mão-de-obra entre empresas lideradas por gestores com MBA e sem MBA?

A explicação está na diferente resposta ao lucro por trabalhador por parte das empresas lideradas por cada tipo de gestor. As empresas lideradas por gestores sem MBA têm maior probabilidade de compartilhar quaisquer lucros excedentes com seus trabalhadores: um aumento de 10% no lucro por trabalhador está associado a um aumento de 1% nos salários. Por outro lado, nas empresas dirigidas por gestores com MBA, um aumento do lucro por trabalhador não tem qualquer impacto nos seus salários.

Por que os gestores com formação em negócios têm menos probabilidade de compartilhar os lucros de suas empresas com seus funcionários?

É porque esses indivíduos são muito exigentes, mais propensos a adotar uma linha dura com o trabalho e mais propensos a buscar pessoas diplomadas ou com práticas em gestão de negócios, focados em resultados e lucros. Esse modelo de gestão ficou mais evidente nos anos 1980, quando grande parte das empresas do mundo adotou a reengenharia e downsizing, promovendo a cultura da empresa enxuta e maximização de lucros.

Com base em sua análise de dados, os autores demonstram que a aversão a compartilhar lucros é adquirida principalmente nas escolas de MBA. Como evidência adicional, eles citam duas ideias propagadas por escolas de MBA que influenciaram os gestores de negócios nas últimas quatro décadas.

A primeira ideia é de que maximizar o valor do acionista deve ser o objetivo principal dos gestores, apresentado pela primeira vez por economistas na década de 1970, principalmente pelo economista da Universidade de Chicago e ganhador do Prêmio Nobel Milton Friedman. Em um artigo da NY Times Magazine de 1970, “A responsabilidade social das empresas é aumentar seus lucros”, Friedman escreveu:

“Em um sistema de livre iniciativa e propriedade privada, um executivo corporativo é um funcionário dos proprietários do negócio. Ele tem responsabilidade direta com seus empregadores. Essa responsabilidade é conduzir os negócios de acordo com seus desejos, que geralmente serão ganhar tanto dinheiro quanto possível, em conformidade com as regras básicas da sociedade, tanto as consagradas na lei quanto as consagradas no costume ético.” Preocupações de negócios além de obter lucro – como “promover fins sociais desejáveis” ou “fornecer empregos, eliminar a discriminação, evitar a poluição e tudo o mais” equivaliam a “pregar o socialismo puro e não adulterado“.

Esses pontos de vista foram amplamente adotados pela comunidade empresarial, incluindo a Business Roundtable (BRT), — uma associação de CEOs de grandes empresas americanas. Mas diminuíram consideravelmente após a crise financeira de 2008. Em 2019, o BRT divulgou uma declaração atualizada sobre o propósito de uma corporação que se afastou de seu compromisso anterior com a primazia do acionista para agora enfatizar um “compromisso com todas as partes interessadas” e com “uma economia que serve a todos os americanos”.

A segunda ideia é nossa obsessão com eficiência econômica e corporações enxutas. A crença de que a eficiência é fundamental para a vantagem competitiva transformou a gestão em uma ciência, cujo objetivo é a eliminação do desperdício, seja de tempo, materiais ou capital, escreveu Roger Martin, professor da Universidade de Toronto, em “The High Price of Efficiency” um artigo de janeiro de 2019 na Harvard Business Review. “Por que não queremos que os gerentes se esforcem para um uso cada vez mais eficiente dos recursos?”, ele perguntou. Um foco excessivo na eficiência pode produzir efeitos negativos surpreendentes.

O problema é que, nas últimas quatro décadas, tratamos a economia como uma espécie de máquina que pode ser dividida em partes, cada uma das quais, sendo otimizadas para criar um ‘todo’ eficiente. Em princípio, o modelo pretendia produzir uma grande evolução no meio social (uma grande classe média), com uma diminuição dos resultados nas extremidades superior e inferior, correspondendo tanto às famílias mais ricas quanto às mais pobres. As famílias mais ricas fariam investimentos e pagariam impostos substancialmente mais altos que ajudariam a todos, especialmente as famílias mais pobres.

Mas, a máquina econômica não tem funcionado como esperado, ponto também levantado por Acemoglu no podcast. De 1947 a 1976, a renda média das famílias americanas cresceu mais de 2,4% CGR. Como resultado, a renda familiar mediana dobrou em uma geração de 30 anos. Mas, de 1977 a 2019, a renda média cresceu apenas 0,6% CGR, o que significa que a renda familiar média aumentou apenas 31% nos últimos 42 anos.

“Na medida em que as escolas de negócios foram a vanguarda dessas ideias que se tornaram mais difundidas entre os gestores e foram propagadas por consultores de gestão, nossas estimativas devem ser vistas como limites inferiores sobre os efeitos dessas práticas de gestão”, observou o artigo do NBER. “Se assim for, tanto nos Estados Unidos quanto na Dinamarca, as práticas de gestão que priorizam o retorno para o acionista e o corte de custos podem ter contribuído significativamente para o declínio da participação de lucros ao trabalhador e para a desaceleração dos salários.”

No final do podcast, Dubner perguntou a Acemoglu o que ele diria aos alunos de um curso de MBA se fossem convidados a ministrar um curso sobre o impacto dos líderes na estagnação salarial.

“Eu sugeriria dois caminhos para uma reflexão mais aprofundada”, disse Acemoglu. “Por mais poderoso que seja um líder empresarial – ou um líder político, ou até mesmo um ditador – seu poder está embutido nas normas da sociedade. Se as normas da sociedade não forem permissivas, ele não será capaz de fazer esse tipo de coisa. O símbolo das forças de que estamos falando são pessoas como Jack Welch. Jack Welch era tão poderoso quanto qualquer CEO seria, e ele é um exemplo de CEOs que cortaram salários. Mas Jack Welch não teria sido capaz de fazer o que fez se a sociedade, amigos e vizinhos, seus acionistas – não aceitassem as políticas e o estilo de gestão que ele trouxe”.

“E segundo, eu sugeriria rever o que realmente ensinamos às pessoas nessas instituições, sobre posições de poder? precisamos voltar aos programas de estudos, voltarmos às dicas que as pessoas recebem nas escolas de negócios ou em outros ambientes semelhantes, incluindo talvez em empresas de consultoria de gestão.”

WCalazans

21/06/2023

Pode um sistema de IA exibir inteligência de senso comum?

18/06/2023

As escolas de negócios e a estagnação salarial

Além da Guerra de Preços: O Oceano Azul na Conectividade Brasileira

Denunciar abuso