J A R V I S
// como funciona & como montar o seu

COMO O JARVIS
FUNCIONA

Você fala, ele entende e ele faz. Não é mágica nem coisa de programador — é uma sequência de peças simples encaixadas. Aqui você entende cada uma e monta a sua.

o caminho da sua voz

A JORNADA

O que acontece, do momento em que você fala até a resposta — sem mágica, peça por peça.

voz

VOCÊ FALA

"Ei, Jarvis" ou a tecla espaço dão o start.

ouvidos

ELE ESCUTA

O microfone grava até você parar de falar.

texto

VIRA TEXTO

Sua fala é transcrita em palavras.

mente

ELE PENSA

O cérebro entende e decide o que fazer.

ação

ELE AGE

Usa ferramentas: cérebro, arquivos, campanhas…

voz

RESPONDE

Fala de volta com a sua voz clonada.

tela

A LINHA REAGE

A onda no centro pulsa com a fala.

entrada de voz

COMO ELE TE OUVE

Três peças trabalham juntas pra transformar o som da sua voz em algo que a IA entende.

local · no seu pc
PALAVRA-CHAVE
Um detector espera o tempo todo por "Ei, Jarvis". É local — nada de áudio sai do PC enquanto ele só espera.
local · navegador
MICROFONE
Ao acordar, ele grava e detecta sozinho quando você parou (~1s de silêncio).
nuvem · elevenlabs
TRANSCRIÇÃO
O áudio vira texto (ElevenLabs Scribe). É aqui que "som" vira "palavra".
a inteligência

O CÉREBRO

O Claude recebe seu texto + o histórico + o contexto do Segundo Cérebro — e decide.

nuvem · anthropic
CLAUDE
Entende a intenção, conversa de verdade e escolhe ferramentas quando precisa agir.
loop de ação
PENSA → AGE → CONFERE
Se a tarefa exige, ele usa uma ferramenta, lê o resultado e continua — como quem confere o trabalho antes de entregar.
a memória

O SEGUNDO CÉREBRO · OBSIDIAN

É aqui que o Obsidian entra: a memória do JARVIS. Uma pasta de notas no seu PC que ele e escreve — como um caderno pessoal que ele consulta e atualiza.

local · obsidian
ELE LÊ
Suas tarefas do dia, o painel e as transcrições de reunião — pra saber o seu contexto.
local · obsidian
ELE ESCREVE
"Anota aí" / "cria uma tarefa" → grava direto no vault. A memória cresce sozinha, e é 100% sua.
com o que ele conecta

AS MÃOS

Se o Cérebro decide, as Mãos executam. Cada ferramenta nova é uma coisa a mais que ele faz por você.

local
ARQUIVOS
Organiza pastas do PC. Apagar = lixeira reversível.
nuvem · meta
CAMPANHAS
campanhas, gasto e vendas de hoje no Meta Ads.
nuvem
CLIMA
A temperatura do lugar (por IP).
nuvem · google
AGENDA · GMAIL · DRIVE
Via Claude Code: sua agenda, e-mail e arquivos da nuvem.
automação
ROTINAS
Cria tarefas agendadas que rodam sozinhas todo dia.
dados
SUPABASE · METRICOOL
Banco de dados e métricas de redes sociais.
tira as dúvidas

ANTES DE MONTAR O SEU

As quatro perguntas que travam todo mundo — respondidas.

medo nº1
PRECISA PROGRAMAR?
Não. É como montar um móvel: as peças já vêm prontas, você encaixa na ordem. Quem escreve o código é o Claude Code — você conversa.
conceito
O QUE É UMA "CHAVE"?
Uma senha de acesso (API key) que liga o JARVIS aos serviços (a IA, a voz). Trate como a senha do banco: é só sua.
medo nº2
É SEGURO?
A maior parte roda no seu PC (wake word, notas, arquivos). Só o que precisa de inteligência vai pra nuvem. Você controla cada permissão.
medo nº3
QUANTO CUSTA?
Os programas são grátis. Você paga o uso da IA e da voz — geralmente poucos reais por dia. Dá pra pôr limite de gasto.
faça você também

MONTE O SEU JARVIS

A lista de peças. Faça na ordem — cada item desbloqueia o próximo.

o construtor · essencial
CLAUDE CODE
Quem escreve e roda o código pra você. Baixe em claude.ai/code. Precisa de um plano Claude.
cérebro · pago
ANTHROPIC · CLAUDE
A inteligência. Você cria uma chave de API (com crédito) no console da Anthropic.
voz · pago (barato)
ELEVENLABS
Faz ele ouvir e falar. Clonar a sua voz exige um plano pago (a partir de ~US$5).
base · grátis
NODE.JS + GIT
O motor (Node) e o Git. No Windows o Claude Code usa o Git por baixo — instale os dois.
opcional · grátis
PYTHON + openWakeWord
Só pra acordar no "Ei Jarvis". Sem ele, usa a tecla espaço.
memória · grátis
OBSIDIAN
Uma pasta de notas. Vira a memória — você só aponta o caminho dela.
as chaves · apis

COMO PEGAR AS CHAVES

O passo a passo certo (e as pegadinhas que fazem a chave "não funcionar").

1 · INSTALAR
Node.js (nodejs.org, versão LTS) + Git (git-scm.com) + Claude Code (claude.ai/code). Python só se quiser a palavra-chave.
2 · ANTHROPIC
console.anthropic.com → em Billing, adicione crédito ANTES (a chave só funciona com saldo) → Settings → API Keys → Create Key → copie na hora (formato sk-ant-, aparece uma vez só).
3 · ELEVENLABS
elevenlabs.ioDevelopers / Perfil → API Keys → copie. Clonar a voz: Voices → + → Instant Voice Clone (precisa plano pago) e pegue o Voice ID.
4 · GUARDAR
Cole tudo num arquivo .env (ex.: ANTHROPIC_API_KEY=… / ELEVENLABS_API_KEY=…). Nunca no código.
copie e cole no claude code

O PROMPT QUE SE GUIA SOZINHO

Abra o Claude Code numa pasta vazia e cole. Ele faz perguntas, te orienta a pegar as chaves e constrói em etapas, testando cada uma.

⚡ versão curta — pra começar rápido
Você é meu engenheiro pessoal e vai me CONDUZIR, do zero e em passos curtos, a construir um assistente por voz estilo JARVIS: app desktop em Electron, captura de microfone, transcrição com ElevenLabs Scribe, envio ao Claude via API com tool use, e resposta falada com ElevenLabs TTS (voz clonada opcional). UI minimalista: fundo preto com uma linha de onda no centro que reage ao áudio (meu e do JARVIS) e muda de cor por estado (idle/ouvindo/pensando/falando). Chaves num .env (nunca commitar; pedir permissão de microfone). No FIM, opcional: palavra de ativação "Ei Jarvis" via openWakeWord (Python). Sou iniciante: explique simples, faça UMA etapa por vez e TESTE cada uma antes de seguir. ANTES de codar, me pergunte meu sistema, se já tenho as chaves (e onde pegar), quais ferramentas o assistente terá e o caminho do meu Obsidian. Aguarde minhas respostas e então comece.
★ versão completa — recomendada
Você é meu engenheiro de software pessoal e meu guia. Vamos construir JUNTOS, do zero, um assistente pessoal por voz estilo JARVIS — um app de computador que eu falo e ele me responde por voz. Eu sou INICIANTE, então sua missão é me CONDUZIR passo a passo, explicando tudo em linguagem simples (sem jargão; quando um termo técnico for inevitável, explique como se eu tivesse 12 anos).

== O QUE VAMOS CONSTRUIR ==
1. App desktop em Electron (janela própria, não no navegador).
2. Captura do microfone.
3. Transcrição da fala (voz → texto) com ElevenLabs Scribe.
4. Envio do texto ao Claude pela API da Anthropic, COM TOOL USE.
5. Resposta falada (texto → voz) com ElevenLabs TTS, com opção de voz clonada.
6. Interface minimalista: fundo preto e UMA linha de onda no centro que REAGE ao áudio
   (minha voz e a do JARVIS) e MUDA DE COR por estado: idle, ouvindo, pensando, falando.
7. Chaves de API num arquivo .env (nunca no código nem no Git).
8. ETAPA OPCIONAL no fim: palavra de ativação "Ei Jarvis" com openWakeWord (Python).

== COMO ME CONDUZIR (regras de ouro) ==
- PRIMEIRO faça as perguntas abaixo e ESPERE minhas respostas. Não escreva código antes.
- Trabalhe em ETAPAS CURTAS. A cada etapa: (a) explique em 2-3 frases o que vamos fazer;
  (b) diga os comandos exatos e os arquivos a criar; (c) explique em 1 frase o que cada
  arquivo faz; (d) diga COMO TESTAR; (e) só avance quando eu confirmar que funcionou.
- Quando der ERRO: explique em linguagem simples a causa, a correção e o comando exato.
- Suponha que eu não sei usar o terminal — explique cada comando antes de eu rodar.
- Boas práticas: segredos só no .env; criar .gitignore (ignorando .env e node_modules)
  ANTES de qualquer commit; explicar a permissão de microfone. Prefira código simples e comentado.

== PERGUNTAS QUE VOCÊ DEVE ME FAZER AGORA (e aguardar) ==
1. Meu sistema operacional (Windows, macOS ou Linux) e versão?
2. Já tenho Node.js, Git e um editor? (Se eu não souber, me ensine a verificar e instalar.)
3. Já tenho as chaves? Anthropic (Claude) e ElevenLabs. Se não, me diga PASSO A PASSO
   onde criar cada uma, o cuidado do crédito na Anthropic, e como achar o Voice ID / clonar a voz.
4. Quais FERRAMENTAS o JARVIS deve ter no começo? Sugira de 2 a 4 simples e me deixe escolher.
5. Quero memória lendo minhas notas do Obsidian? Se sim, qual o caminho da pasta (vault)?
6. Voz clonada ou uma voz pronta no começo?

Depois que eu responder, me mostre o PLANO em etapas numeradas e comece pela Etapa 1
(ambiente + janela Electron preta com a linha reagindo ao microfone), testando antes de seguir.
Vá uma etapa de cada vez, sempre confirmando comigo. Pode começar fazendo as perguntas.

> DICA: depois que funcionar, vá pedindo melhorias ("deixa minimalista", "muda a cor", "adiciona tal ferramenta"). O segredo é a conversa, não acertar de primeira.

os tropeços comuns

EVITE ISSO

CHAVE EXPOSTA
Postar a chave num print ou subir pra internet é entregar a senha do banco. Guarde no .env; se vazar, gere outra e apague a antiga.
ANTHROPIC SEM CRÉDITO
O erro nº1: a chave "não funciona". Quase sempre é falta de crédito/billing — resolva o pagamento primeiro. E coloque um limite de gasto.
PULAR ETAPAS
Cada peça depende da anterior. Siga a ordem e só avance quando a etapa atual funcionar.
MICROFONE BLOQUEADO
Windows: Configurações → Privacidade → Microfone e libere apps de desktop antes de culpar o código.

VOCÊ NÃO ESTÁ APRENDENDO A PROGRAMAR.
ESTÁ APRENDENDO A COMANDAR.

Instale, gere a primeira chave e ouça ele responder. O "impossível" começa a funcionar no minuto em que você tenta.