Como lidar com dados não-estruturados usando Python
Keywords #python, nltk, huggingface, pln Sumário Entenda a diferença entre tipos de dados, como analisar dados não-estruturados, tudo isto usando Python. Por fim, você será capaz de construir o seu primeiro modelo capaz de identificar se uma mensagem é positiva, negativa ou neutra! Tópicos Dados Informações Padrões Tipos de Dados Texto Um exemplo simples, mas complexo A monalisa da inteligência artificial Frameworks Python Na Prática Código Entendendo o código HuggingFace Transformers Conclusão Introdução Imagine que você está ensinando seu filho como andar de bicicleta, há todo um protocolo, é preciso escolher terrenos amigáveis, adicionar equipamentos adequados....
Agentes não são uma invenção, são a evolução de uma ideia antiga
Agentes Se há um fato sobre os Agentes, é que eles não são novidade. A própria OpenAI evita utilizar esse termo ao se referir ao ChatGPT, justamente porque ele é reservado para mecanismos verdadeiramente autônomos. Não podemos negar: hoje existe uma histeria coletiva em torno do tema. Há dezenas de ferramentas disponíveis para a criação desses sistemas, e também muita confusão — ou falta de compreensão — sobre o que realmente são os agentes, qual sua arquitetura e quando, de fato, é necessário desenvolver um....
A Ilusão do Pensamento
Explicando o polêmico paper da APPLE LRMs apresentam limitações a partir de certas complexidades, assim como os LLMs. Em alguns casos, performam pior que LLMs. É sabido que LRMs por vezes apresentam raciocínio distante da resposta mostrada e que também às vezes “pensam demais” e retornam mais conteúdo que o necessário. Objetivo dos autores: analisar as limitações dos LRMs. LRMs são modelos que aplicam a técnica chamada reasoning, equivalente humano a “pensar”....
O Excesso de Produção e Suas Consequências: Uma Reflexão Necessária
Observe ao seu redor. Com certeza, o nosso maior problema hoje é lidar com a quantidade de conteúdo produzido, e não com sua ausência. A contrapartida? Em geral, todo esse conteúdo disponível se apresenta em sua forma leve: trata-se de algo raso, que não foi trabalhado e que tem pouco a acrescentar para quem o produz, e menos ainda para quem se dispõe a consumir esse tipo de conteúdo. Disso decorre a seguinte lógica: quanto mais rápido for produzido um conteúdo, mais leve ele será....
O processo da escrita na era do ChatGPT
Introdução Muitas pessoas querem aproveitar a praticidade dos modelos de linguagem para produzir conteúdo rápido e em grande escala, mas esse uso excessivo tem deixado claro que boa parte da internet já soa como escrita por máquinas. Mesmo que isso não surpreenda mais ninguém, devemos reconhecer que os modelos generativos estão aqui para ficar e precisamos aprender a usá-los com mais intenção e autenticidade. Leitores querem consumir conteúdos relevantes e originais na internet, mas o aumento de textos gerados por IA tem trazido materiais genéricos, marcados por padrões repetitivos que revelam sua origem artificial....
DeepSeek-R1
Olá pessoal, não iria escrever mais essa semana, mas resolvi compartilhar com vocês para lhes manter informados (aqueles que optaram por seguir na carreira com IA). Para o caso de você não estar ciente, o DeepSeek-R1 é um novo modelo generativo desenvolvido por uma startup chinesa. Além de representar um novo modelo no mercado, os criadores afirmam que se trata do mais novo rival do ChatGPT. Mas não de qualquer rival....
Aprenda inglês criando metas que fazem sentido e usando o tempo que você tem disponível?
Sumário: Aprenda a estudar inglês sem que isso lhe tome horas do seu dia, definindo metas flexíveis e estudando como uma “criança”. Quando decidi aprender Inglês, iniciei uma longa busca na internet pelos especialistas no tema, os poliglotas. A inda guardo no meu peito alguns deles, foram fundamentais em minha jornada, mas há algo que nunca esqueci . Um vídeo do canal What I’ve Learnt, intitulado, “How To Learn a Language: INPUT (Why most methods don’t work)”....
How Do Machines Learn?
Types of Learning The types of learning determine what resources will be necessary to solve our problems. As suggested Mohri (2018), there are four fundamental types of learning, each with its specifications: Supervised machine learning Semi-supervised learning Unsupervised machine learning Reinforcement learning In this essay, we’ll use supervised machine learning for simplicity. Generally, we use this approach to handle regression problems and classification. A regression problem needs a real output, such as the mean value of a house, while classification typically results in a binary output (e....
Understanding Gradient Descent
Nowadays, even the most sophisticated tools that use AI are favored by the optimization algorithm, Gradient Descent. From ChatGPT to Midjourney, the concept is applicable due to the central theme in Machine Learning: minimizing the cost function. This post aims to give readers a general overview of this tool, which exists beyond the field of Machine Learning but plays a crucial role, being continuously mentioned in tutorials, books, or videos when the topic is Artificial Intelligence....
Perceptron: The Neuron That Will Help You Understand Neural Networks
What is the utility of the perceptron? The perceptron was created in 1943 by Warren McCulloch and Walter Pitts. The fundamental idea behind its architecture is the ability to map an input value (x1, x2, …, xn) to a simple binary output value. However, the perceptron has some limitations, such as being useful only for binary classifications and requiring that the problem be linearly separable (which will be discussed later)....