GenAI Guardrails: Kdo to dělá nejlépe jako služba? Šifrovaná síť má tři režimy: { Přísný | Shovívavý | Otevřeno }. "Strict" ve výchozím nastavení zabraňuje dospělému/explicitnímu obsahu a výměnou za to má přístup ke špičkovým, proprietárním modelům. "Permisivní" (výchozí) má dvojí strategii: nejprve se pokusit pracovat s více poskytovateli (v případě falešných poplachů) a vrátit se k přepsání požadavku kvůli bezpečnosti. "Otevřený" neposuzuje obsah a nachází naplnění v decentralizované síti poskytovatelů, kteří mohou být otevřenější dospělému obsahu. --- To znamená, že abychom zabránili *nelegálnímu* obsahu, stále máme silné ochranné mantinely, jako jsou ústavní klasifikátory. Hlava 22? Spoléhání se na externí modely pro posuzování obsahu může být samo o sobě porušením podmínek služby poskytovatele. (Jako by byl automaticky směrován na tajné modely OpenAI). Kdo to dělá nejlépe? Společnost Anthropic ve svém nedávném bezpečnostním hackathonu předvedla některé opravdu silné schopnosti. Kdo jiný?
Myšlenkový experiment: jak byste decentralizovali samotné mantinely a zároveň zachovali soukromí uživatelů? Jedním z nápadů by bylo zacházet s ním jako s "mixovací" službou: jako Tornado Cash pro obsah místo mincí. Měli byste několik uzlů, které přijímají dávky obsahu ke kontrole a používají důkazy ZK k potvrzení legálního/nelegálního + hodnocení obsahu pro každý z nich, ale neznají zdroje. Pak by brána mohla odmítnout práci a poskytnout důkaz "proč", aniž by byla obviněna ze zbytečné zaujatosti/cenzury. Pak by byly součástí motivované sítě na vrstvě brány.
Příklad: řekněme, že jsem vytvořil obálku k vašim přihlašovacím údajům AWS s přístupem k Bedrock Guardrails. Za přispění k mixování jsme pak zaplatili malou prémii v ETH na Base, spravovaném možná prototypem koordinační služby postavené v @eigenlayer EigenCloud. Pak by se mohl kdokoli připojit a distribuovat zátěž a míchání obsahu. Potřebuji k tomu změřit latenci.
Zobrazit originál
2,02 tis.
5
Obsah na této stránce poskytují třetí strany. Není-li uvedeno jinak, společnost OKX není autorem těchto informací a nenárokuje si u těchto materiálů žádná autorská práva. Obsah je poskytován pouze pro informativní účely a nevyjadřuje názory společnosti OKX. Nejedná se o doporučení jakéhokoli druhu a nemělo by být považováno za investiční poradenství ani nabádání k nákupu nebo prodeji digitálních aktiv. Tam, kde se k poskytování souhrnů a dalších informací používá generativní AI, může být vygenerovaný obsah nepřesný nebo nekonzistentní. Další podrobnosti a informace naleznete v připojeném článku. Společnost OKX neodpovídá za obsah, jehož hostitelem jsou externí weby. Držená digitální aktiva, včetně stablecoinů a tokenů NFT, zahrnují vysokou míru rizika a mohou značně kolísat. Měli byste pečlivě zvážit, zde je pro vás obchodování s digitálními aktivy nebo jejich držení vhodné z hlediska vaší finanční situace.