Melaya — Build AI agents for any job. Agentic platform for research, ops, outreach, reporting — and the only one where agents can actually trade.

// USE CASE · QUANT

Prouve l'alpha d'abord,ne déploie que ce qui survit.

La moitié de tes backtests prometteurs meurent trois semaines après le passage en paper trading, et le post-mortem est toujours le même : sensibilité aux paramètres que personne n'a testée, coût d'exécution que personne n'a modélisé, un régime à travers lequel personne n'a walké la stratégie. Melaya monte un crew d'agents IA quant à six personas qui fait tourner qualité du signal, coût d'exécution, sizing de position, risque et un pass skeptic sur chaque candidat, puis rédige le memo deploy-or-kill que ton PM peut signer en cinq minutes.

Voir les pipelines ↓
01
// Ce qui casse aujourd'hui

Le statu quo coûte plus cher que l'agent.

Trois douleurs que chaque équipe sales et BD encaisse chaque semaine. Chacune est ce dont tes reps se plaignent vraiment, pas ce qu'une page produit appellerait poliment.

  1. 01

    La moitié des stratégies qui déploient avec un Sharpe de 2.1 dans le backtest tombent sous 0.8 dans les six semaines de paper trading, et le post-mortem rattrape le même overfit chaque trimestre.

  2. 02

    Le coût d'exécution est estimé à un flat 5 bp parce que personne sur le desk n'a le temps de décomposer spread, impact et adverse selection par stratégie, donc le P&L live rate la cible de 30 à 60 pour cent.

  3. 03

    Le reporting de risque est un scramble Excel du vendredi soir : VaR paramétrique dans un workbook, VaR historique dans un autre, stress tests dans un troisième, et le CRO signe à l'aveugle.

02
// Pipelines que tu peux construire

Compose. Approuve. Rejoue.

Chaque pipeline ci-dessous est une forme que tu câbles sur le canvas en utilisant le crew d'agents IA et les outils plus bas. Pas une feature qu'on livre pour toi, un pattern que tu configures.

P01

Scorer la qualité du signal de facteur

Faire tourner IC, Sharpe avec erreur standard, demi-vie de décay d'alpha, et sensibilité aux paramètres sur un facteur candidat, en appliquant correction Bonferroni ou Benjamini-Hochberg à travers la grille testée. Le Static context tient la bibliothèque de facteurs et les seuils de significativité du desk.

P02

Décomposer le coût d'exécution

Prendre les fills du backtest et décomposer le coût en spread bid-ask, impact marché et adverse selection Glosten-Milgrom. L'outil database scopé lit uniquement les captures de ticks, pas d'écritures broker possibles depuis ce workflow.

P03

Dimensionner avec Kelly et corrélation

Calculer Kelly fractionnel à 0.25x à 0.5x contre le book live avec une matrice de corrélation shrinked Ledoit-Wolf. Le gate HITL bloque le changement d'allocation tant que le PM n'a pas approuvé la taille, le set de corrélation et la cible de volatilité.

P04

Stress test et poser des limites dures

Faire tourner VaR paramétrique, VaR historique, CVaR et corrections de queue Cornish-Fisher, puis rejouer les stress books 2008, 2020 et 2022. La mémoire cross-run reporte les seuils de circuit breaker de la revue précédente pour que les limites ne se réinitialisent pas chaque lundi.

P05

Faire tourner le pass skeptic et overfitting

Scorer le Deflated Sharpe Ratio contre le nombre de trials, exiger une validation walk-forward, et refuser tout backtest single-regime. L'outil rag_retrieve tire les stratégies passées qui ont échoué pour que le même pattern d'overfit ne passe pas deux fois.

P06

Rédiger le memo deploy-or-kill

Synthétiser les cinq sections spécialistes en un memo avec une ligne ACTION de DEPLOY, PAPER_TRADE, BACKTEST_MORE, PAUSE ou KILL et les paramètres recommandés exacts. Le replay capture chaque appel d'outil pour que la conformité puisse auditer le verdict de bout en bout.

03
// Le crew d'agents IA

Crew firme quant

Vrais personas du crew d'agents IA quant_firm. Chacun arrive avec un system prompt tuné et une allowlist de outils par défaut. Change de modèle par persona sur le canvas.

Quant Analyst

QuantAnalyst

Runs signal-quality analysis on a strategy: IC, Sharpe with standard errors, parameter sensitivity, and Bonferroni or Benjamini-Hochberg correction across the tested combinations.

Execution Specialist

ExecutionSpecialist

Decomposes execution cost into bid-ask spread, market impact, and adverse selection, then quantifies the conditions under which slippage and latency wipe out the edge.

Portfolio Manager

PortfolioManager

Sizes the strategy with fractional Kelly and a Ledoit-Wolf shrunk correlation matrix, then decides whether it earns a slot next to the live book.

Chief Risk Officer

ChiefRiskOfficer

Computes parametric and historical VaR, CVaR, and Cornish-Fisher tail corrections, runs the 2008, 2020, and 2022 stress books, and sets hard circuit breakers.

Quant Skeptic

QuantSkeptic

Scores overfitting with the Deflated Sharpe Ratio, refuses any strategy without walk-forward validation, and issues an APPROVED, CONDITIONAL, or REJECTED verdict with the exact failure conditions.

Report Writer

ReportWriter

Distills the five specialist sections into one PM-ready memo with an ACTION line of DEPLOY, PAPER_TRADE, BACKTEST_MORE, PAUSE, or KILL, and exact recommended parameters.

04
// outils scopés

Uniquement les actions que tu autorises.

Chaque outil ci-dessous est un vrai outil partagé du bundle Melaya. Allowlist par agent, HITL sur les écritures, révocation en un clic.

shared/tools/finance/

Tirer l'historique de prix, les indicateurs techniques, les taux FX et les séries macro pour la recherche de facteurs et les tests de régime out-of-sample. Lecture seule par design, pas d'écritures broker possibles depuis ce bundle.

alphavantage_stock_pricealphavantage_stock_historyalphavantage_stock_indicatorsfx_ratealphavantage_macro_dataalphavantage_sector_performance
shared/tools/knowledge/

Construire le knowledge store par workflow à partir des specs de stratégie, des tearsheets précédentes, des post-mortems et des docs de politique de risque. Alimente les trois couches de connaissance que QuantAnalyst et QuantSkeptic appellent. Écritures vers le store du workflow uniquement, jamais vers le système de trading live.

build_knowledge_from_textbuild_knowledge_from_file
shared/tools/database/

Lire la sortie de backtest, les captures de ticks et l'attribution P&L depuis ton warehouse. Les appels destructifs sql_execute et sqlite_execute sont HITL-gated et désactivés par défaut pour ce crew.

sql_querysql_schemasql_export_csvsqlite_query
shared/tools/aiml/

Extraire des tables depuis les PDF de recherche, les tearsheets vendors et les dépôts de risque précédents en inputs structurés que le QuantAnalyst peut citer. Pas d'écritures ; lit uniquement les fichiers vers lesquels tu le pointes.

hf_summarizehf_text_classifypdf_to_textpdf_extract_tables
shared/tools/data_utils/

Valider les exports CSV de backtest, résumer les distributions avant qu'elles n'atteignent l'analyst, et hasher les fichiers de résultats pour que le journal d'audit puisse prouver que la tearsheet sous revue est la même que celle que le PM a signée.

csv_lintdf_describejson_validatehash_file
shared/tools/msoffice/

Lire les risk books Excel PM-facing et émettre le memo deploy-or-kill final comme doc Word que l'archive conformité peut ingérer. Toutes les écritures sont HITL-gated et stagent vers un dossier brouillon, jamais en écrasant la version précédente.

excel_read_sheetexcel_write_dataword_createword_add_paragraphs
shared/tools/messaging/

Déposer le memo deploy-or-kill du ReportWriter dans le canal desk une fois qu'un humain a approuvé. HITL par défaut, avec le même journal d'audit que toute autre écriture.

discord_send_messagetelegram_send_message
05
// Trois couches de connaissance

La crew d’agents IA lit ce que tu lui donnes.

Chaque pipeline arrive avec trois couches d’accès à la connaissance. Combine-les par agent sur le canvas. Pas d’espace vectoriel partagé avec un autre client, pas de lecture surprise, pas de retrieval opaque.

L1

Static context

includeContext

Documents par pipeline ajoutés à l'input d'agents spécifiques à chaque run. Le brief ICP, le playbook, la grille de pricing, ou le corpus d'emails de deals gagnés. Tout ce qui doit être là avant que l'agent pense. Tu choisis quels personas reçoivent quels docs.

L2

Tool de retrieval RAG

rag_retrieve

Un outilscoped accordé par agent. Quand l'agent décide qu'il a besoin de plus de profondeur, il interroge le vector store du workflow à la demande. Même base de knowledge que Static context, accédée uniquement quand le modèle le demande.

L3

Mémoire cross-run

pipeline_memory

État au niveau du pipeline qui passe d'un run au suivant. La recherche d'hier est dans le scope du follow-up d'aujourd'hui. Le crew d'agents IA se souvient de ce qu'il a déjà prospecté, de ce qui a été approuvé, de ce qui a été envoyé. L'audit log est la base de knowledge de second ordre.

07
// FAQ

Les questions qu'on reçoit chaque semaine.

Les agents vont-ils placer des ordres live tout seuls ?

Non. L'équipe quant exécute avec HITL sur chaque ordre, changement d'allocation et édition de limite de risque. Les agents font la recherche, le backtest, le scoring et rédigent le memo de deploy. Un humain appuie sur le bouton pour le capital.

Les agents peuvent-ils raisonner sur nos backtests et données tick ?

Trois voies. Le Static context attache la spec de stratégie, les définitions de facteur et la politique de risque à des personas spécifiques à chaque run. L'outil rag_retrieve permet à QuantAnalyst et QuantSkeptic de tirer depuis les logs de backtest, les tearsheets passées et les post-mortems précédents à la demande. La mémoire cross-run garde les résultats walk-forward d'hier dans le scope du test de régime d'aujourd'hui.

Est-ce une alternative à QuantConnect ou WorldQuant ?

Non, ça se branche à côté. QuantConnect fait tourner ton moteur de backtest. WorldQuant héberge la compétition de facteurs. Melaya est la couche de recherche et de revue qui score le signal, dimensionne la position et met en attente le memo de deploy. Ton backtester reste ton backtester.

Comment éviter que l'analyse sonne comme une tearsheet IA générique ?

Chaque métrique cite sa taille d'échantillon et sa fenêtre temporelle. QuantAnalyst reporte le Sharpe avec son erreur standard, QuantSkeptic reporte le Deflated Sharpe avec le nombre de trials, et ReportWriter refuse d'adoucir un verdict REJECTED. Les reviewers peuvent exiger une citation sur chaque claim comme pré-check HITL.

Sur quels modèles peut-on faire tourner ce crew ?

N'importe lesquels. Claude sur QuantSkeptic là où le raisonnement adversaire justifie le coût, GPT sur le ReportWriter, et un Ollama local sur le QuantAnalyst quand la spec de stratégie et les données tick doivent rester dans ton VPC. Chaque agent choisit le sien.

À quelle vitesse une équipe quant peut-elle lancer son premier pipeline de revue ?

Avec ta sortie de backtest posée dans S3 ou un warehouse SQL, le workflow signal-quality vers deploy-memo est un canvas à 4 nœuds : ingest résultats, faire tourner QuantAnalyst plus QuantSkeptic, gater sur le verdict, rédiger le memo. La plupart des desks le déploient dans une session de travail et revoient la première stratégie le jour même.

Comment ça gère le changement de régime et la validation walk-forward ?

QuantSkeptic refuse toute stratégie sans validation walk-forward et au moins un régime out-of-sample. Le persona CRO fait tourner les stress books 2008, 2020 et 2022 sur l'allocation proposée. Si l'un des deux échoue, ReportWriter ne peut pas sortir une action DEPLOY par design.

Puis-je auditer exactement ce que l'agent a fait et pourquoi ?

Chaque run logge chaque étape, chaque appel d'outil, chaque invocation de modèle et chaque décision d'approbation. Replay n'importe quel run à tout moment. Le journal d'audit est le risk log, et il sauvegarde avec le memo de deploy dans ton archive conformité.

Peut-on restreindre quels agents peuvent écrire dans notre broker ou système de risque ?

Oui. Le scoping d'outils est par agent. Le QuantSkeptic et le QuantAnalyst tournent en lecture seule contre les stores de backtest. Seul le PortfolioManager peut mettre en attente un changement d'allocation, et ce changement est HITL-gated par défaut. Le CRO est la seule persona autorisée à éditer les seuils de circuit breaker.

Construis des pipelines équipes quant research & trading sur Melaya.

Le tier Sandbox est gratuit, sans carte. Rejoins la waitlist et on t'envoie un email dès qu'un slot s'ouvre.

← Retour à tous les cas d'usage
discord.joinCta