GenAI Guardrails: Quem está a fazer isto melhor como serviço? A Rede Scrypted tem três modos: { Estrito | Permissivo | Aberto }. "Estrito" impede conteúdo maduro/explícito por padrão e, em troca, tem acesso a modelos proprietários de topo. "Permissivo" (padrão) tem uma estratégia de duas frentes, primeiro tentando o trabalho com múltiplos fornecedores (em caso de falsos positivos) e, em seguida, recorrendo à reescrita do pedido para segurança. "Aberto" não julga o conteúdo e encontra satisfação numa rede descentralizada de fornecedores, que pode estar mais aberta a conteúdo maduro. --- Dito isto, para prevenir conteúdo *ilegal*, ainda temos fortes guardrails, como classificadores constitucionais. O Catch-22? Confiar em modelos externos para julgar conteúdo pode, por si só, ser uma violação dos Termos de Serviço do fornecedor. (Como ser redirecionado automaticamente para os modelos secretos da OpenAI). Quem está a fazer isto melhor? A Anthropic mostrou algumas capacidades realmente fortes no seu recente hackathon de segurança. Quem mais?
Experimento mental: como descentralizar a própria barreira de proteção enquanto se mantém a privacidade do usuário? Uma ideia seria tratá-la como um serviço de "mistura": como o Tornado Cash para conteúdo em vez de moedas. Teríamos múltiplos nós que recebem lotes de conteúdo para revisar, e eles usam provas ZK para atestar a legalidade/ilegalidade + classificação do conteúdo para cada um deles, mas não conhecem as fontes. Então, o gateway poderia rejeitar trabalhos e fornecer prova do "porquê" sem ser acusado de viés/censura desnecessária. Assim, eles fariam parte de uma rede incentivada na camada do gateway.
Exemplo: digamos que criei um wrapper para as suas credenciais AWS com acesso ao Bedrock Guardrails. Então, para contribuir para a mistura, pagámos um pequeno prémio em ETH na Base, gerido, talvez, por um serviço de coordenação protótipo construído no @eigenlayer EigenCloud. Então, qualquer um poderia participar e distribuir a carga e a mistura de conteúdo. Preciso medir a latência para isso.
Mostrar original
1,76 mil
3
O conteúdo apresentado nesta página é fornecido por terceiros. Salvo indicação em contrário, a OKX não é o autor dos artigos citados e não reivindica quaisquer direitos de autor nos materiais. O conteúdo é fornecido apenas para fins informativos e não representa a opinião da OKX. Não se destina a ser um endosso de qualquer tipo e não deve ser considerado conselho de investimento ou uma solicitação para comprar ou vender ativos digitais. Na medida em que a IA generativa é utilizada para fornecer resumos ou outras informações, esse mesmo conteúdo gerado por IA pode ser impreciso ou inconsistente. Leia o artigo associado para obter mais detalhes e informações. A OKX não é responsável pelo conteúdo apresentado nos sites de terceiros. As detenções de ativos digitais, incluindo criptomoedas estáveis e NFTs, envolvem um nível de risco elevado e podem sofrer grandes flutuações. Deve considerar cuidadosamente se o trading ou a detenção de ativos digitais é adequado para si à luz da sua condição financeira.