COMO O JARVIS
FUNCIONA

Você fala, ele entende e ele faz. Não é mágica nem coisa de programador — é uma sequência de peças simples encaixadas. Aqui você entende cada uma e monta a sua.

o caminho da sua voz

A JORNADA

O que acontece, do momento em que você fala até a resposta — sem mágica, peça por peça.

voz

VOCÊ FALA

"Ei, Jarvis" ou a tecla espaço dão o start.

→

ouvidos

ELE ESCUTA

O microfone grava até você parar de falar.

→

texto

VIRA TEXTO

Sua fala é transcrita em palavras.

→

mente

ELE PENSA

O cérebro entende e decide o que fazer.

→

ação

ELE AGE

Usa ferramentas: cérebro, arquivos, campanhas…

→

voz

RESPONDE

Fala de volta com a sua voz clonada.

→

tela

A LINHA REAGE

A onda no centro pulsa com a fala.

entrada de voz

COMO ELE TE OUVE

Três peças trabalham juntas pra transformar o som da sua voz em algo que a IA entende.

local · no seu pc

PALAVRA-CHAVE

Um detector espera o tempo todo por "Ei, Jarvis". É local — nada de áudio sai do PC enquanto ele só espera.

local · navegador

MICROFONE

Ao acordar, ele grava e detecta sozinho quando você parou (~1s de silêncio).

nuvem · elevenlabs

TRANSCRIÇÃO

O áudio vira texto (ElevenLabs Scribe). É aqui que "som" vira "palavra".

a inteligência

O CÉREBRO

O Claude recebe seu texto + o histórico + o contexto do Segundo Cérebro — e decide.

nuvem · anthropic

CLAUDE

Entende a intenção, conversa de verdade e escolhe ferramentas quando precisa agir.

loop de ação

PENSA → AGE → CONFERE

Se a tarefa exige, ele usa uma ferramenta, lê o resultado e continua — como quem confere o trabalho antes de entregar.

a memória

O SEGUNDO CÉREBRO · OBSIDIAN

É aqui que o Obsidian entra: a memória do JARVIS. Uma pasta de notas no seu PC que ele lê e escreve — como um caderno pessoal que ele consulta e atualiza.

local · obsidian

ELE LÊ

Suas tarefas do dia, o painel e as transcrições de reunião — pra saber o seu contexto.

local · obsidian

ELE ESCREVE

"Anota aí" / "cria uma tarefa" → grava direto no vault. A memória cresce sozinha, e é 100% sua.

com o que ele conecta

AS MÃOS

Se o Cérebro decide, as Mãos executam. Cada ferramenta nova é uma coisa a mais que ele faz por você.

local

ARQUIVOS

Organiza pastas do PC. Apagar = lixeira reversível.

nuvem · meta

CAMPANHAS

Vê campanhas, gasto e vendas de hoje no Meta Ads.

nuvem

CLIMA

A temperatura do lugar (por IP).

nuvem · google

AGENDA · GMAIL · DRIVE

Via Claude Code: sua agenda, e-mail e arquivos da nuvem.

automação

ROTINAS

Cria tarefas agendadas que rodam sozinhas todo dia.

dados

SUPABASE · METRICOOL

Banco de dados e métricas de redes sociais.

tira as dúvidas

ANTES DE MONTAR O SEU

As quatro perguntas que travam todo mundo — respondidas.

medo nº1

PRECISA PROGRAMAR?

Não. É como montar um móvel: as peças já vêm prontas, você encaixa na ordem. Quem escreve o código é o Claude Code — você conversa.

conceito

O QUE É UMA "CHAVE"?

Uma senha de acesso (API key) que liga o JARVIS aos serviços (a IA, a voz). Trate como a senha do banco: é só sua.

medo nº2

É SEGURO?

A maior parte roda no seu PC (wake word, notas, arquivos). Só o que precisa de inteligência vai pra nuvem. Você controla cada permissão.

medo nº3

QUANTO CUSTA?

Os programas são grátis. Você paga o uso da IA e da voz — geralmente poucos reais por dia. Dá pra pôr limite de gasto.

faça você também

MONTE O SEU JARVIS

A lista de peças. Faça na ordem — cada item desbloqueia o próximo.

o construtor · essencial

CLAUDE CODE

Quem escreve e roda o código pra você. Baixe em claude.ai/code. Precisa de um plano Claude.

cérebro · pago

ANTHROPIC · CLAUDE

A inteligência. Você cria uma chave de API (com crédito) no console da Anthropic.

voz · pago (barato)

ELEVENLABS

Faz ele ouvir e falar. Clonar a sua voz exige um plano pago (a partir de ~US$5).

base · grátis

NODE.JS + GIT

O motor (Node) e o Git. No Windows o Claude Code usa o Git por baixo — instale os dois.

opcional · grátis

PYTHON + openWakeWord

Só pra acordar no "Ei Jarvis". Sem ele, usa a tecla espaço.

memória · grátis

OBSIDIAN

Uma pasta de notas. Vira a memória — você só aponta o caminho dela.

as chaves · apis

COMO PEGAR AS CHAVES

O passo a passo certo (e as pegadinhas que fazem a chave "não funcionar").

1 · INSTALAR

Node.js (nodejs.org, versão LTS) + Git (git-scm.com) + Claude Code (claude.ai/code). Python só se quiser a palavra-chave.

2 · ANTHROPIC

console.anthropic.com → em Billing, adicione crédito ANTES (a chave só funciona com saldo) → Settings → API Keys → Create Key → copie na hora (formato sk-ant-, aparece uma vez só).

3 · ELEVENLABS

elevenlabs.io → Developers / Perfil → API Keys → copie. Clonar a voz: Voices → + → Instant Voice Clone (precisa plano pago) e pegue o Voice ID.

4 · GUARDAR

Cole tudo num arquivo .env (ex.: ANTHROPIC_API_KEY=… / ELEVENLABS_API_KEY=…). Nunca no código.

copie e cole no claude code

O PROMPT QUE SE GUIA SOZINHO

Abra o Claude Code numa pasta vazia e cole. Ele faz perguntas, te orienta a pegar as chaves e constrói em etapas, testando cada uma.

⚡ versão curta — pra começar rápido

Você é meu engenheiro pessoal e vai me CONDUZIR, do zero e em passos curtos, a construir um assistente por voz estilo JARVIS: app desktop em Electron, captura de microfone, transcrição com ElevenLabs Scribe, envio ao Claude via API com tool use, e resposta falada com ElevenLabs TTS (voz clonada opcional). UI minimalista: fundo preto com uma linha de onda no centro que reage ao áudio (meu e do JARVIS) e muda de cor por estado (idle/ouvindo/pensando/falando). Chaves num .env (nunca commitar; pedir permissão de microfone). No FIM, opcional: palavra de ativação "Ei Jarvis" via openWakeWord (Python). Sou iniciante: explique simples, faça UMA etapa por vez e TESTE cada uma antes de seguir. ANTES de codar, me pergunte meu sistema, se já tenho as chaves (e onde pegar), quais ferramentas o assistente terá e o caminho do meu Obsidian. Aguarde minhas respostas e então comece.

★ versão completa — recomendada

Você é meu engenheiro de software pessoal e meu guia. Vamos construir JUNTOS, do zero, um assistente pessoal por voz estilo JARVIS — um app de computador que eu falo e ele me responde por voz. Eu sou INICIANTE, então sua missão é me CONDUZIR passo a passo, explicando tudo em linguagem simples (sem jargão; quando um termo técnico for inevitável, explique como se eu tivesse 12 anos).

== O QUE VAMOS CONSTRUIR ==
1. App desktop em Electron (janela própria, não no navegador).
2. Captura do microfone.
3. Transcrição da fala (voz → texto) com ElevenLabs Scribe.
4. Envio do texto ao Claude pela API da Anthropic, COM TOOL USE.
5. Resposta falada (texto → voz) com ElevenLabs TTS, com opção de voz clonada.
6. Interface minimalista: fundo preto e UMA linha de onda no centro que REAGE ao áudio
   (minha voz e a do JARVIS) e MUDA DE COR por estado: idle, ouvindo, pensando, falando.
7. Chaves de API num arquivo .env (nunca no código nem no Git).
8. ETAPA OPCIONAL no fim: palavra de ativação "Ei Jarvis" com openWakeWord (Python).

== COMO ME CONDUZIR (regras de ouro) ==
- PRIMEIRO faça as perguntas abaixo e ESPERE minhas respostas. Não escreva código antes.
- Trabalhe em ETAPAS CURTAS. A cada etapa: (a) explique em 2-3 frases o que vamos fazer;
  (b) diga os comandos exatos e os arquivos a criar; (c) explique em 1 frase o que cada
  arquivo faz; (d) diga COMO TESTAR; (e) só avance quando eu confirmar que funcionou.
- Quando der ERRO: explique em linguagem simples a causa, a correção e o comando exato.
- Suponha que eu não sei usar o terminal — explique cada comando antes de eu rodar.
- Boas práticas: segredos só no .env; criar .gitignore (ignorando .env e node_modules)
  ANTES de qualquer commit; explicar a permissão de microfone. Prefira código simples e comentado.

== PERGUNTAS QUE VOCÊ DEVE ME FAZER AGORA (e aguardar) ==
1. Meu sistema operacional (Windows, macOS ou Linux) e versão?
2. Já tenho Node.js, Git e um editor? (Se eu não souber, me ensine a verificar e instalar.)
3. Já tenho as chaves? Anthropic (Claude) e ElevenLabs. Se não, me diga PASSO A PASSO
   onde criar cada uma, o cuidado do crédito na Anthropic, e como achar o Voice ID / clonar a voz.
4. Quais FERRAMENTAS o JARVIS deve ter no começo? Sugira de 2 a 4 simples e me deixe escolher.
5. Quero memória lendo minhas notas do Obsidian? Se sim, qual o caminho da pasta (vault)?
6. Voz clonada ou uma voz pronta no começo?

Depois que eu responder, me mostre o PLANO em etapas numeradas e comece pela Etapa 1
(ambiente + janela Electron preta com a linha reagindo ao microfone), testando antes de seguir.
Vá uma etapa de cada vez, sempre confirmando comigo. Pode começar fazendo as perguntas.

> DICA: depois que funcionar, vá pedindo melhorias ("deixa minimalista", "muda a cor", "adiciona tal ferramenta"). O segredo é a conversa, não acertar de primeira.

os tropeços comuns

EVITE ISSO

CHAVE EXPOSTA

Postar a chave num print ou subir pra internet é entregar a senha do banco. Guarde no .env; se vazar, gere outra e apague a antiga.

ANTHROPIC SEM CRÉDITO

O erro nº1: a chave "não funciona". Quase sempre é falta de crédito/billing — resolva o pagamento primeiro. E coloque um limite de gasto.

PULAR ETAPAS

Cada peça depende da anterior. Siga a ordem e só avance quando a etapa atual funcionar.

MICROFONE BLOQUEADO

Windows: Configurações → Privacidade → Microfone e libere apps de desktop antes de culpar o código.

VOCÊ NÃO ESTÁ APRENDENDO A PROGRAMAR.
ESTÁ APRENDENDO A COMANDAR.

Instale, gere a primeira chave e ouça ele responder. O "impossível" começa a funcionar no minuto em que você tenta.