Melaya — Build AI agents for any job. Agentic platform for research, ops, outreach, reporting — and the only one where agents can actually trade.

// CASO DE USO · QUANT

Prove o alfa primeiro,entregue só o que sobreviver.

Metade dos seus backtests promissores morre três semanas dentro do paper trading, e o post-mortem é sempre o mesmo: sensibilidade de parâmetro que ninguém testou, custo de execução que ninguém modelou, um regime pelo qual ninguém passou a estratégia. Melaya monta um crew quant de seis personas que roda qualidade de sinal, custo de execução, dimensionamento de posição, risco e uma passada cética em cada candidata, depois redige o memo de deploy-or-kill que seu PM pode assinar em cinco minutos.

Ver os pipelines ↓
01
// O que quebra hoje

O status quo custa mais que o agente.

Três dores que toda equipe de vendas e BD enfrenta toda semana. Cada uma é o que seus reps realmente reclamam, não o que uma página de funcionalidade chamaria.

  1. 01

    Metade das estratégias que entram com Sharpe 2,1 no backtest cai abaixo de 0,8 dentro de seis semanas de paper trading, e o post-mortem pega o mesmo overfit a cada trimestre.

  2. 02

    Custo de execução é estimado como um flat 5 bps porque ninguém na mesa tem tempo de decompor spread, impacto e adverse selection por estratégia, então o P&L ao vivo erra o alvo em 30 a 60 por cento.

  3. 03

    O reporting de risco é uma correria de Excel na sexta à noite: VaR paramétrico em uma planilha, VaR histórico em outra, stress tests em uma terceira, e o CRO assina no escuro.

02
// Pipelines que você pode construir

Componha. Aprove. Replay.

Cada pipeline abaixo é uma forma que você monta no canvas usando o crew e as ferramentas mais abaixo. Não é uma funcionalidade que entregamos pronta, é um padrão que você configura.

P01

Pontua qualidade de sinal do fator

Roda IC, Sharpe com erro padrão, meia-vida de alpha decay e sensibilidade de parâmetro em um fator candidato, aplicando correção Bonferroni ou Benjamini-Hochberg na grade testada. O contexto estático guarda a biblioteca de fatores e os limiares de significância da mesa.

P02

Decompõe custo de execução

Pega os fills do backtest e decompõe custo em bid-ask spread, impacto de mercado e adverse selection Glosten-Milgrom. A ferramenta de database escopada lê apenas tick captures, sem possibilidade de escritas em broker a partir deste workflow.

P03

Dimensiona com Kelly e correlação

Computa Kelly fracional em 0,25x a 0,5x contra o livro ao vivo usando uma matriz de correlação encolhida Ledoit-Wolf. O gate HITL bloqueia a mudança de alocação até o PM aprovar o tamanho, o conjunto de correlação e o alvo de volatilidade.

P04

Stress test e define limites duros

Roda VaR paramétrico, VaR histórico, CVaR e correções de cauda Cornish-Fisher, depois faz replay dos books de stress de 2008, 2020 e 2022. A memória entre runs carrega limiares de circuit-breaker da revisão anterior para que os limites não resetem toda segunda.

P05

Roda a passada cética e de overfitting

Pontua o Deflated Sharpe Ratio contra a contagem de trials, exige validação walk-forward e recusa qualquer backtest de regime único. A ferramenta rag_retrieve puxa estratégias que falharam antes para que o mesmo padrão de overfit não passe duas vezes.

P06

Redige o memo deploy-or-kill

Sintetiza as cinco seções de especialista em um memo com uma linha ACTION de DEPLOY, PAPER_TRADE, BACKTEST_MORE, PAUSE ou KILL e parâmetros recomendados exatos. O replay captura cada chamada de ferramenta para que o compliance possa auditar o veredicto de ponta a ponta.

03
// O crew

Crew de firma quant

Personas reais do crew quant_firm. Cada uma vem com um system prompt afinado e uma allowlist de ferramentas padrão. Troque modelos por persona no canvas.

Analista Quant

QuantAnalyst

Roda análise de qualidade de sinal em uma estratégia: IC, Sharpe com erros padrão, sensibilidade de parâmetro e correção Bonferroni ou Benjamini-Hochberg nas combinações testadas.

Especialista em Execução

ExecutionSpecialist

Decompõe custo de execução em bid-ask spread, impacto de mercado e adverse selection, depois quantifica as condições sob as quais slippage e latência apagam a vantagem.

Gerente de Portfólio

PortfolioManager

Dimensiona a estratégia com Kelly fracional e uma matriz de correlação encolhida Ledoit-Wolf, depois decide se ela ganha um slot ao lado do livro ao vivo.

Chief Risk Officer

ChiefRiskOfficer

Computa VaR paramétrico e histórico, CVaR e correções de cauda Cornish-Fisher, roda os books de stress de 2008, 2020 e 2022 e define circuit breakers duros.

Cético Quant

QuantSkeptic

Pontua overfitting com o Deflated Sharpe Ratio, recusa qualquer estratégia sem validação walk-forward e emite um veredicto APROVADO, CONDICIONAL ou REJEITADO com as condições exatas de falha.

Redator de Relatório

ReportWriter

Destila as cinco seções de especialista em um memo pronto para o PM com uma linha ACTION de DEPLOY, PAPER_TRADE, BACKTEST_MORE, PAUSE ou KILL, e parâmetros recomendados exatos.

04
// ferramentas com escopo

Só as ações que você concede.

Cada ferramenta abaixo é uma ferramenta compartilhada real do bundle Melaya. Allowlist por agente, HITL nas escritas, revogação em um clique.

shared/tools/finance/

Puxa histórico de preços, indicadores técnicos, taxas de FX e séries macro para pesquisa de fator e testes de regime fora de amostra. Somente leitura por design, sem possibilidade de escritas em broker a partir deste bundle.

alphavantage_stock_pricealphavantage_stock_historyalphavantage_stock_indicatorsfx_ratealphavantage_macro_dataalphavantage_sector_performance
shared/tools/knowledge/

Monta o knowledge store por workflow a partir de specs de estratégia, tearsheets anteriores, post-mortems e docs de política de risco. Alimenta as três camadas de conhecimento que QuantAnalyst e QuantSkeptic consultam. Escritas vão apenas para o store do workflow, nunca para o sistema de trading ao vivo.

build_knowledge_from_textbuild_knowledge_from_file
shared/tools/database/

Lê output de backtest, tick captures e atribuição de PnL do seu warehouse. As chamadas destrutivas sql_execute e sqlite_execute são HITL-gated e desligadas por padrão para este crew.

sql_querysql_schemasql_export_csvsqlite_query
shared/tools/aiml/

Extrai tabelas de PDFs de pesquisa, tearsheets de fornecedores e arquivos anteriores de risco em inputs estruturados que o QuantAnalyst pode citar. Sem escritas; lê apenas os arquivos para os quais você apontar.

hf_summarizehf_text_classifypdf_to_textpdf_extract_tables
shared/tools/data_utils/

Valida exports CSV de backtest, sumariza distribuições antes que cheguem ao analista e gera hash dos arquivos de resultado para que o log de auditoria possa provar que o tearsheet em revisão é o mesmo que o PM assinou.

csv_lintdf_describejson_validatehash_file
shared/tools/msoffice/

Lê books de risco em Excel voltados para o PM e emite o memo final de deploy-or-kill como um doc Word que o arquivo de compliance pode ingerir. Todas as escritas são HITL-gated e vão para uma pasta de draft, nunca sobrescrevendo a versão anterior.

excel_read_sheetexcel_write_dataword_createword_add_paragraphs
shared/tools/messaging/

Deposita o memo deploy-or-kill do ReportWriter no canal da mesa depois que um humano aprovar. HITL por padrão, com o mesmo log de auditoria de qualquer outra escrita.

discord_send_messagetelegram_send_message
05
// Três camadas de conhecimento

O crew lê o que você dá a ele.

Cada pipeline vem com três camadas de acesso ao conhecimento. Combine por agente no canvas. Sem espaço vetorial compartilhado com outro cliente, sem leitura surpresa, sem recuperação opaca.

L1

Contexto estático

includeContext

Documentos por pipeline anexados à entrada de agentes específicos a cada run. O brief de ICP, playbook, tabela de preços ou corpus de emails de deals ganhos. O que precisa estar lá antes do agente pensar. Você escolhe quais personas recebem quais docs.

L2

Ferramenta de recuperação RAG

rag_retrieve

Uma ferramenta com escopo concedida por agente. Quando o agente decide que precisa de mais profundidade, ele consulta o base vetorial do workflow sob demanda. Mesma base de conhecimento do Contexto estático, acessada só quando o modelo pede.

L3

Memória entre runs

pipeline_memory

Estado em nível de pipeline que carrega de um run para o próximo. A pesquisa de ontem está no escopo do follow-up de hoje. O crew lembra do que já prospectou, do que foi aprovado, do que foi enviado. O audit log é a base de conhecimento de segunda ordem.

07
// FAQ

Perguntas que recebemos toda semana.

Os agentes vão colocar ordens ao vivo por conta própria?

Não. O crew quant vem com HITL em cada ordem, mudança de alocação e edição de limite de risco. Os agentes pesquisam, fazem backtest, pontuam e redigem o memo de deploy. Um PM humano aperta o botão no capital.

Os agentes conseguem raciocinar sobre nossos backtests e dados de tick?

De três formas. O contexto estático anexa a spec da estratégia, definições de fator e política de risco a personas específicas em cada run. A ferramenta rag_retrieve permite que QuantAnalyst e QuantSkeptic puxem de registros de backtest, tearsheets passados e post-mortems anteriores sob demanda. A memória entre runs mantém os resultados walk-forward de ontem em escopo para o teste de regime de hoje.

Isto é uma alternativa ao QuantConnect ou WorldQuant?

Não, fica ao lado deles. QuantConnect roda seu engine de backtest. WorldQuant hospeda a competição de fator. Melaya é a camada de pesquisa-e-revisão que pontua o sinal, dimensiona a posição e prepara o memo de deploy. Seu backtester continua sendo seu backtester.

Como evitar que a análise pareça um tearsheet genérico de IA?

Cada métrica cita seu tamanho de amostra e janela de tempo. O QuantAnalyst reporta Sharpe com seu erro padrão, o QuantSkeptic reporta o Deflated Sharpe com a contagem de trials, e o ReportWriter recusa suavizar um veredicto REJEITADO. Revisores podem exigir uma citação em cada claim como pré-check HITL.

Em quais modelos podemos rodar este crew?

Qualquer um. Claude no QuantSkeptic onde o raciocínio adversarial justifica o custo, GPT no ReportWriter, e um Ollama local no QuantAnalyst quando a spec da estratégia e os dados de tick precisam ficar dentro da sua VPC. Cada agente escolhe o seu.

Quão rápido um time quant consegue colocar o primeiro pipeline de revisão para rodar?

Com seu output de backtest sentado em S3 ou em um warehouse SQL, o workflow de qualidade-de-sinal-até-memo-de-deploy é um canvas de 4 nós: ingerir resultados, rodar QuantAnalyst mais QuantSkeptic, gate no veredicto, redigir o memo. A maioria das mesas entrega isso em uma sessão de trabalho e revisa a primeira estratégia no mesmo dia.

Como isso lida com mudança de regime e validação walk-forward?

O QuantSkeptic recusa qualquer estratégia sem validação walk-forward e ao menos um regime fora de amostra. A persona CRO roda os books de stress de 2008, 2020 e 2022 na alocação proposta. Se qualquer um falhar, o ReportWriter não pode emitir uma ação DEPLOY por design.

Consigo auditar exatamente o que o agente fez e por quê?

Cada run loga cada passo, cada chamada de ferramenta, cada invocação de modelo e cada decisão de aprovação. Faça replay de qualquer run a qualquer momento. O log de auditoria é o log de risco, e ele segue com o memo de deploy para o seu arquivo de compliance.

Podemos restringir quais agentes podem escrever no nosso broker ou sistema de risco?

Sim. O escopo de ferramenta é por agente. O QuantSkeptic e o QuantAnalyst rodam somente leitura contra stores de backtest. Apenas o PortfolioManager pode preparar uma mudança de alocação, e essa mudança é HITL-gated por padrão. O CRO é a única persona autorizada a editar limiares de circuit-breaker.

Construa pipelines de equipes de pesquisa quant e trading na Melaya.

O plano Sandbox é grátis e sem cartão. Entre na lista de espera e enviaremos um email no momento em que abrir uma vaga.

← Voltar para todos os casos de uso
discord.joinCta