Introdução
Dia 30 de novembro de 2022 marca a data em que a plataforma ChatGPT-3 foi disponibilizada gratuitamente ao público em geral. A partir de então, vivenciamos uma aceleração da já acirrada corrida entre as grandes empresas de tecnologias, envolvendo novas dimensões em funcionalidades já conhecidas e apontando para novidades inéditas.
Entre tantas especiais características da recém lançada tecnologia, está incluído que podemos pedir que ela mesma se defina. Ao solicitarmos, vejamos o que o que ela tem a dizer sobre si mesma:
“ChatGPT-3 é o estado da arte na área de modelos de linguagem, tendo sido desenvolvido pela empresa OpenAI. Ele é baseado na arquitetura GPT-3 (Transformador Generativo Pré-treinado 3) tendo sido aprimorado via o uso de uma imensa quantidade de textos. Ele tem a habilidade de gerar textos nos moldes similares aos humanos, responder questões gerais e completar várias tarefas baseadas na utilização de linguagens. A ferramenta ChatGTP-3 desempenha bem também em um largo espectro de tarefas envolvendo processamentos de linguagem natural, tais como sumarização de textos e transformações de textos para áudios. Adicionalmente, ela tem a habilidade de gerar textos a partir de alguns poucos dados fornecidos, sendo única em sua dimensão e capacidade de resposta rápida. ChatGPT-3 é considerada um dos mais avançados modelos de linguagem disponíveis e continua, progressivamente, a ser atualizado e aprimorado”.
O que viabiliza a ferramenta ChatGPT-3 é o advento da inteligência artificial, em especial a aprendizagem de máquina, associados a uma incrível e inédita capacidade computacional e uma quantidade impressionante de bancos de dados atualmente disponíveis.
A utilização desses recursos já está mais bem estabelecida em outras aplicações anteriores, como, por exemplo, reconhecimento facial. Assim, entender, preliminarmente, como funciona a técnica de reconhecimento facial permite, por analogia, dimensionar melhor o impacto, presente e futuro, da nova abordagem ChatGPT-3 e similares.
Acerca de ferramentas anteriores e tecnologias similares
No caso de reconhecimento facial, imagens são captadas por uma câmera e enviadas para análise no próprio sistema. Ele detectará a presença de um ou mais rostos e, a partir disso, fará o processamento das informações coletadas. A imagem será convertida em um formato monolítico normalizado, com o intuito de deixá-la padronizada para, então, analisar todas as informações relevantes. Esse processo é chamado de codificação e é a partir dele que a face passa a ser reconhecida (ou não) em comparação com o banco de dados disponível.
Entre as características observadas nas imagens estão as medidas faciais, chamadas também de pontos nodais. Em geral, adota-se que o rosto humano possui aproximadamente 80 desses pontos. Entre eles estão a distância entre os olhos, contorno da face, o tamanho do queixo, a curvatura e espessura dos lábios e o comprimento do nariz, bem como cicatrizes e eventuais características específicas. Essas informações funcionam como digitais da face, uma espécie de assinatura. Dessa forma, o sistema realiza um cruzamento de dados e padrões, tornando possível, em tese, reconhecer o indivíduo em questão, por meio de um banco de informações anteriormente cadastradas no sistema.
Redes neurais estão na essência dessa operação. Cada traço de um item da face é quantificado e depois multiplicado por um peso numérico, refletindo o quanto aquela particular característica contribui para diagnosticar a categoria desejada. Os valores ponderados são somados e um patamar é adotado para aceitação (ou não) da identificação proposta. Em uma representação visual em duas camadas, uma camada inferior contém as múltiplas características mensuráveis (neurônios de entrada) e na camada superior o conjunto de faces disponíveis no banco de dados disponível (neurônios de saída). Cada neurônio de entrada se liga (sinapse) a cada neurônio de saída via intensidades variáveis, podendo oscilar de muito positivo até muito negativo.
Uma relevante questão inicial é quem define o peso a ser atribuído a cada variável/conexão neural. A surpreendente resposta mais simples e direta seria simplesmente ninguém ou, se quiserem uma inicialização aleatória. Em outras palavras, praticamente tanto faz a inicialização. O que importa é o processo, a dinâmica posterior. É a experiência, baseada em erros e acertos na sequência que vai, gradativamente, ajustando esses padrões. É assim que a rede é treinada ou, em outras palavras, que a máquina “aprende”. A cada iteração, um novo ajuste da distribuição de pesos. Ou seja, os erros são muito bem-vindos e fazem parte inerentes do processo de busca ou de acerto.
Para problemas mais complexos (reconhecimento facial sofisticado é um deles), é, em geral, demandada a inserção de mais camadas intermediárias ocultas, bem como incluir outras três dimensões ou mais, trabalhando novas categorias, refletindo semelhanças parciais. Sistemas de aprendizado profundo, em geral, envolvem redes com muitas camadas ocultas intermediárias.
Observar que essa maneira de operar suplanta a chamada inteligência artificial clássica, a qual é baseada, principalmente, em deduções e lógica, permitindo ser codificada manualmente. Ou seja, diferentemente das abordagens clássicos, sistemas de aprendizado profundo dispensam, em tese, conceitos preliminares ou mesmo inferências lógicas.
Trata-se de uma novidade extraordinária, comum a todas essas aplicações, desde reconhecimento facial à ChatGPT-3. É uma mudança complexa, dado que por muito tempo imaginamos que a razão humana e suas aplicações fossem, basicamente, frutos de uma lista de conceitos preliminares guiada por uma série de regras lógicas bem estabelecidas. O Iluminismo, teoria filosófica com grande influência nos séculos passados, levou essa crença às últimas consequências. Mais recentemente, o computador e a programação computacional tradicional derivam também, de alguma forma, dessas mesmas concepções.
A mudança mais drástica implica em substituir a manipulação simples de cadeias de símbolos, via um conjunto de regras, derivadas de conceitos e lógica, pela agregação de múltiplos sinais, associados cada um deles a uma particular propriedade, em uma dinâmica que permite aprender continuamente via erros e acertos. As redes neurais artificiais e os sistemas de aprendizagem profundo são expressões mais evidentes e funcionais dessa tendência.
Essencial perceber que o funcionamento das redes neurais baseadas em aprendizado profundo não permite identificar, ao menos claramente, conceitos ou inferências lógicas em sua dinâmica. De fato, os chamados treinamento da rede não são explicitáveis/explicáveis (enquanto sequência lógica baseada em conceitos) sequer pelos próprios desenvolvedores. Em outras palavras, os pressupostos adotados ao longo do processo não são acompanhados estritamente, dificultando eventuais necessidades de identificação e supressão de indesejáveis tendências incorporadas ao longo do processo.
É tentador comparar essas redes de aprendizado profundo com o funcionamento do cérebro humano. Este tem mais de uma centena de bilhões de neurônios, os quais são conectados entre si por centenas de trilhões de sinapses. Tudo se passa como, à similaridade das redes não humanas (inteligência artificial de nova geração), o correspondente ao treinamento se dê ao longo das primeiras infâncias e da juventude, quando somos, especialmente, capacitados a identificar padrões, via associações e combinações.
O amadurecimento da cognição humana, ainda que racionalizável (somos racionais, afinal), embute em seu processo múltiplas etapas que não atendem, ao menos claramente, às lógicas formais e explicitações técnicas. Talvez parte dessa área oculta contribua para entender algumas características mentais que no cotidiano adotamos chamar de poderes mentais extraordinários, incluindo o sobrenatural. Em tal área ainda estamos engatinhando, mas, é curioso destacar que é nossa cognição avançada humana que permite explorar campos complexos e tão obscuros ainda, atestando a priori nossa enorme e peculiar capacidade enquanto espécie.
Steven Pinker aponta para a possibilidade de a racionalidade humana ser um sofisticado sistema híbrido, conjugando operações similares às máquinas acoplados a um outro sistema, este sim de refinada manipulação de símbolos lógicos (curadoria sofisticada). Neste hibridismo, por sua vez, são agregados conceitos, os quais incorporam valores e qualidades morais, introduzindo características humanas, provavelmente invadindo áreas que, por enquanto, parecem ser inalcançáveis pelas máquinas. Ainda na linha de explorarmos o que nós humanos temos que as máquinas parecem não ter. De novo, talvez, parece e por enquanto…
Aplicabilidades educacionais ChatGPT-3
Com relação a como a ferramenta pode ajudar as instituições de ensino educacionais e seus docentes, há várias maneiras. Unicamente a título de ilustração, seguem algumas: i) obtendo respostas imediatas para perguntas complexas, ainda que, felizmente, demandem do indagador espírito crítico e capacidade de curadoria humana; ii) auxiliar na pesquisa, ajudando os estudantes e professores a encontrarem informações relevantes e confiáveis (dentro dos limites conhecidos e com os devidos cuidados, naturalmente); iii) correção de trabalhos, podendo ser treinada a ferramenta para corrigir textos previamente elaborados, tornando este processo mais rápido e, se bem feito (demanda supervisão) eficiente, iv) um assistente virtual para responder a perguntas frequentes e ajudar na comunicação entre professores, estudantes e funcionários; v) na inclusão, podendo ser usado para traduções em tempo real, tornando o ensino mais inclusivo para alunos com diferentes necessidades linguísticas; e vi) em aulas personalizadas baseadas no contexto educacional e no nível e interesses de cada aluno.
Alguns cuidados são fundamentais na implementação do ChatGPT-3, lembrando que ele é treinado previamente com base em dados disponíveis na internet, podendo gerar informações erradas ou desatualizadas. Além disso, a ferramenta pode ter dificuldades para compreender perguntas complexas e contextuais, resultando em respostas equivocadas. Adicionalmente, há que se prevenir a escola e os docentes acerca da eventual dependência excessiva, o que pode, eventualmente, levar a um prejuízo de habilidades críticas, como pensamento independente e capacidade de solução de problemas.
Há que se registrar que o ChatGPT-3 tem apenas alguns poucos meses de vida pública ativa e foi projetado para aprender continuamente. Ou seja, ele ainda está aprendendo, então pode melhorar e muito. Lembremos que aqui, neste caso, aprende-se também com os erros. Os educadores também estamos aprendendo. Há que não temer os erros e com eles, igualmente aprender ao longo de toda a vida.
A redação morreu, viva a redação!
Ao longo dos anos, a redação dissertativa tem sido um dos centros da pedagogia. O ato de redigir um texto é um dos principais meios pelos quais crianças e jovens se educam, aprendendo a pensar e se expressar, defendendo uma ideia. Assim, quando o ChatGPT-3 foi lançado, a revista The Atlantic profetizou: “a redação está morta!”.
De fato, estamos perante uma plataforma nada trivial. As tecnologias digitais têm, ao longo das últimas décadas, transformado as formas como acessamos e selecionamos informações, bem a como produzimos novos conteúdos. A tecnologia ChatGPT-3 e as demais ferramentas de inteligência artificial generativas representam mudanças drásticas nesse processo em curso.
Em especial, apresentando desafios, em escala inédita, no que diz respeito a verificar e editar redações geradas por essas tecnologias, dado que, surpreendentemente, estamos diante de uma ferramenta capaz de escrever redações do zero, a partir de alguns poucos dados fornecidos pelos solicitantes.
Não há, no entanto, nada de original no frenesi nas escolas e entre educadores causado pelas possíveis consequências da adoção da plataforma ChatGPT-3. Especialmente quanto à habilidade de produzir ensaios a partir de uma demanda simples em temas gerais, inclusive complexos, a partir de poucas palavras ou textos simples fornecidos por solicitantes. A preocupação com plágio é uma delas, entre várias.
Lembremos que no passado, Sócrates (há mais de 2,5 milênios) evitava a escrita, entre outros motivos, porque poderia promover entre seus discípulos a preguiça e baixa capacidade de memória que as aulas expositivas demandam. No século XV, com o advento do livro moderno, com Gutenberg, houve quem profetizasse o fim do professor, dado que o livro moderno seria isento de equívocos e sempre disponível. Mais recentemente, as calculadoras e os computadores foram vistos como prenúncios de riscos para a aprendizagem da matemática e da própria valorização do conhecimento, dado que tornado este plenamente acessível e instantâneo.
A realidade é que sempre houve a preocupação de que as tecnologias farão algo melhor do que os humanos. Ainda que, na sequência, em todos os casos até aqui, estes tenham se aproveitado dos avanços para fazer ainda melhor o que eles já faziam antes.
Na prática, uma vez mais, veremos as instituições educacionais sendo criativas e explorando meios de integrar as novas tecnologias, a exemplo da ferramenta ChatGPT-3, em seus currículos e em seus cotidianos escolares. Enfim, há muito espaço de colaboração entre tecnologias digitais e educadores e temos vivenciado isso por décadas.
Na verdade, talvez alguns educadores já tenham sido ‘ludibriados’ por seus educandos, ainda que não soubessem e isso bem antes do ChatGPT-3. Há disponíveis ferramentas computacionais auxiliando na produção de textos há mais de uma década. Entre elas, Grammarly, Chegg ou Google Doc’s Smart Compose. Até mesmo, já estavam disponíveis plataformas capazes de identificar plágios em trabalhos feitos com esses recursos.
É evidente que o caso específico atual está alguns degraus adiante das ferramentas anteriores. A melhor recomendação aos educadores é entender como mais um ousado desafio educacional. Cruzada a ponte da suspeição, sairemos todos, educadores e educandos, mais fortalecidos e dispostos a enfrentar as missões em uma sociedade marcada por inovações e pela educação permanente ao longo de toda a vida.
Pode ser altamente positivo que a avaliação tradicional de textos esteja sendo desafiada, mesmo porque há outros predicados, entre eles a capacidade de pensamento crítico e elementos de razoabilidade que farão parte integrantes das tarefas que começam com o texto gerado pelas plataformas. Esses atributos, associados à capacidade de pensar e de aprender, bem como de juntar, de forma coerente, diferentes áreas do saber para resolver um projeto, têm muito mais a ver com a realidade profissional do futuro do que o simples encadeamento regular de ideias via textos isolados, por mais relevante que isso também seja.
Muitas novidades extraordinárias ainda estão por ocorrer, sem dúvida. Não temos total clareza dos próximos passos. Porém, há boas razões para suspeitar que aqueles profissionais e cidadãos que souberem redigir bem e souberem tratar temas complexos sem o auxílio permanente dessas plataformas, provavelmente, terá um belo futuro pela frente. Parece paradoxal, mas não é.
Não estamos distantes de poder proclamar que, frente àquilo que se apresentou como o novo fim da redação a resposta dos educadores têm sido explorar pedagogicamente o potencial de diálogo e colaboração contínua entre educandos e máquina. E podemos fazê-lo tal que teremos boas razões para proclamar “viva a redação!”.
27