My AI Playground
Os modelos de linguagem de pesos abertos (open weights) evoluíram muito nos últimos meses. Hoje é perfeitamente possível rodar na sua própria máquina modelos tão capazes quanto os principais LLMs comerciais. Mas existe um problema: para o usuário comum, usar esses modelos localmente ainda é complicado demais. Envolve linha de comando, configuração de servidores, download manual de pesos, drivers de GPU, quantizações e uma série de detalhes técnicos pouco amigáveis.
O My AI Playground nasceu justamente desse incômodo. É um projeto gratuito e de código aberto que eu criei para automatizar e simplificar completamente essa experiência, reunindo em um único instalador tudo o que é necessário para rodar IA localmente (incluindo os modelos mais recentes e poderosos do Google, a família Gemma 4) e entregando uma interface de chat no navegador muito similar ao que o usuário já conhece do ChatGPT, Gemini ou Claude.
A proposta é democratizar o acesso a esses modelos: a pessoa baixa um instalador para Windows, executa e, ao final, já tem a aplicação pronta para conversar com uma IA rodando 100% localmente, sem depender de nuvem, sem enviar dados para fora da máquina e sem custos por uso.
Funcionalidades
- Instalador automatizado (Inno Setup) que baixa e configura todas as dependências e os modelos Gemma 4 (versões 2B, 4B e 26B)
- Interface web moderna e responsiva, inspirada nas principais plataformas de IA
- Entrada multimodal: texto, imagens, áudio e arquivos (PDF, Word, Excel, PowerPoint) na mesma conversa
- Transcrição de áudio local com faster-whisper e síntese de voz
- Busca na web integrada, com citação de fontes, para contornar o corte de conhecimento dos modelos
- Respostas em streaming em tempo real, com auto-continuação e edição de mensagens
- Histórico completo de conversas, instruções personalizadas e busca por mensagens
- Aceleração via GPU ou CPU, com suporte a múltiplas arquiteturas
- Suporte a múltiplos idiomas na interface (português, inglês, espanhol e francês)
- Multiplataforma: compatível com Windows, macOS e Linux
- 100% local: nenhum dado sai da sua máquina durante o uso padrão do chat
Tecnologias envolvidas
Do ponto de vista técnico, o projeto me permitiu exercitar um stack bastante completo e atual: Python com FastAPI e SQLAlchemy (SQLite) no backend; React 19 com TypeScript e Vite no frontend; llama.cpp como servidor de inferência (modelos no formato GGUF); faster-whisper para transcrição de áudio; e Inno Setup + scripts PowerShell e Shell para a orquestração do instalador e do ciclo de vida da aplicação (bandeja do sistema, splash screen, detecção de processos órfãos etc.).