Melaya — Build AI agents for any job. Self-directed agentic platform for research, ops, reporting, and trading you run yourself, with your own exchange account and your approval on every order.

// 05 · एजेंटिक फ्रेमवर्क

कितना तेज़ है पाइपलाइन रनर?

टूल डिस्पैच ओवरहेड, RAG रिट्रीवल लेटेंसी, मॉडल-कॉल रैपर लागत, HITL राउंड-ट्रिप वितरण, पाइपलाइन ऑर्केस्ट्रेशन स्टेप-टू-स्टेप। ताज़ा क्लोन से pytest benches/ के ज़रिए reproducible, इंजन बेंच के समान कन्वेंशन।

इंजन बनाम फ्रेमवर्क

यह पेज Python एजेंटिक फ्रेमवर्क मापता है, वह रनर जो पाइपलाइन चरण ऑर्केस्ट्रेट करता है, सीमित टूल कॉल डिस्पैच करता है, RAG रिट्रीवल प्रबंधित करता है, HITL के माध्यम से राइट गेट करता है, और मॉडल कॉल रैप करता है। इन-हाउस Rust ट्रेडिंग इंजन (310 ns पर स्टेट-कैश राइट, 14 µs पर पूर्ण पाइपलाइन) के लिए इंजन लेटेंसी देखें।

रनर आपको क्या देता है

// गवर्नेंस, केवल गति नहीं

नीचे की लेटेंसी साबित करती है कि रनर लीन है। ये गारंटियां हैं जो वास्तविक क्लाइंट के लिए एजेंट चलाना सुरक्षित बनाती हैं। इस पेज पर दस मापे गए हैं, बाकी यह है कि प्लेटफ़ॉर्म कैसे बनाया गया है।

01
स्कोप्ड, शासित टूल्सएक एजेंट टीम केवल वही टूल्स देखती है जो आप उसे देते हैं। बिना अनुमति वाले टूल्स मॉडल के स्कीमा में कभी प्रवेश नहीं करते, इसलिए अनुमतियां डिस्पैच का मूल तत्व हैं, बाद का विचार नहीं।
0.6 µs
02
राइट्स में मानवीय स्वीकृतिहर राइट एनफोर्समेंट गेट (एक रिएक्टिव वॉचर स्टेट, प्रति-साइकिल राइट कैप, प्रति-टेनेंट कोटा, कॉस्ट कैप) से होकर गुजरती है, फिर ऑपरेटर की स्वीकृति की प्रतीक्षा करती है। रीड्स स्वतंत्र रूप से प्रवाहित होती हैं, राइट्स गेटेड होती हैं।
0.3 µs
03
प्रति-वर्कफ़्लो RAGप्रत्येक वर्कफ़्लो को हाइब्रिड रिट्रीवल के साथ अपना अलग वेक्टर स्टोर मिलता है, इसलिए एक क्लाइंट के दस्तावेज़ दूसरे के कॉन्टेक्स्ट में कभी नहीं आते।
0.28 ms
04
अपना मॉडल लाएंएक रैपर के पीछे 20+ प्रोवाइडर (Anthropic, OpenAI, Gemini, Mistral, DeepSeek, Qwen, साथ ही लोकल Ollama और LM Studio), सभी में एक समान आकार।
1.6 µs
05
लागत और टोकन अकाउंटिंगहर मॉडल कॉल को प्रति-मॉडल तालिका के अनुसार मूल्यांकित किया जाता है और एक चलते USD कुल में जोड़ा जाता है, ताकि आप क्लाइंट्स को बिल कर सकें और प्रति टेनेंट खर्च सीमित कर सकें।
0.4 µs
06
पूर्ण ऑब्ज़र्वेबिलिटीप्रत्येक टूल कॉल, मॉडल इनवोकेशन और पाइपलाइन रन के लिए एक OpenTelemetry स्पैन, जिसमें लागत, टोकन, लेटेंसी और त्रुटि कारण शामिल हैं। ऐसे एजेंट संचालित करें जिन्हें आप वास्तव में देख सकें।
0.3 µs
07
स्टैटिक कॉन्टेक्स्ट असेंबलीसिस्टम प्रॉम्प्ट, दिए गए नॉलेज डॉक्स और टूल स्कीमा को प्रत्येक टर्न के कॉन्टेक्स्ट ब्लॉक में पैक किया जाता है जो मॉडल को भेजता है, रोलिंग हिस्ट्री से अलग।
1.4 µs
08
क्रॉस-रन एजेंट टीम मेमोरीएजेंट टीम की वर्किंग मेमोरी रनों के बीच बनी रहती है और अगले रन पर रिस्टोर होती है, इसलिए लंबे समय तक चलने वाले एजेंट सेशन के पार अपना कॉन्टेक्स्ट बनाए रखते हैं।
53 µs
09
एजेंटिक क्रूमल्टी-पर्सोना एजेंट टीमें (मैक्रो, टेक्निकल, रिस्क, एक्ज़ीक्यूशन) कॉन्टेक्स्ट को पर्सोना से पर्सोना तक हस्तांतरित करती हैं, एक रिस्क वीटो और रिएक्टिव साइडकार के साथ जो रन के बीच में चेन को रोक सकते हैं।
1.2 µs
10
प्रॉम्प्ट-इंजेक्शन रक्षाएजेंट जो भी किसी अविश्वसनीय स्रोत (पुनर्प्राप्त दस्तावेज़, टूल परिणाम, फ़ेच किए गए वेब पेज) से पढ़ता है, उसे मॉडल के उपयोग से पहले प्रॉम्प्ट-इंजेक्शन, जेलब्रेक और डेटा-एक्सफ़िल्ट्रेशन पैटर्न के लिए स्कैन किया जाता है। प्रत्येक पैटर्न में एक गंभीरता स्कोर होता है और कुल स्कोर परिणाम तय करता है: सुरक्षित टेक्स्ट पास हो जाता है, हल्के संदिग्ध टेक्स्ट को डेटा के रूप में घेरकर पास किया जाता है जिसे मॉडल को मानना नहीं चाहिए और घटना लॉग की जाती है, स्पष्ट रूप से दुर्भावनापूर्ण संकेत जैसे कि किसी रहस्य को लीक करने या वार्तालाप प्रारूप को हाईजैक करने का प्रयास, मॉडल के देखने से पहले ही हटा दिया जाता है। यह कटऑफ़ कितना सख्त हो, यह प्रति डिप्लॉयमेंट ट्यून किया जा सकता है।
17 µs
11
क्रेडेंशियल आइसोलेशनप्रति-उपयोगकर्ता एन्क्रिप्टेड वॉल्ट। एजेंट शॉर्ट-लिव्ड टिकट के माध्यम से कार्य करते हैं और कभी भी कच्ची API कुंजियों को नहीं छूते, इसलिए किसी क्लाइंट के रहस्य उसी क्लाइंट तक सीमित रहते हैं।
AES-256
12
डिज़ाइन से मल्टी-टेनेंटप्रोजेक्ट-स्कोप्ड भूमिकाएं और प्रति-पाइपलाइन स्टेट आइसोलेशन। एक टेनेंट की एजेंट टीम दूसरे का डेटा पढ़, उसे रोक, या उसके विरुद्ध खर्च नहीं कर सकती। एक प्लेटफ़ॉर्म पर कई क्लाइंट चलाएं।
RBAC
समुदाय से जुड़ें