GenAI Guardrails: ¿Quién está haciendo esto mejor como servicio?
La red cifrada tiene tres modos: { Estricto | Permisivo | Abrir }.
"Estricto" evita el contenido para adultos / explícito de forma predeterminada y, a cambio, tiene acceso a los mejores modelos propietarios.
"Permisivo" (predeterminado) tiene una estrategia doble de intentar primero el trabajo con múltiples proveedores (en caso de falsos positivos) y volver a reescribir la solicitud de seguridad.
"Abierto" no juzga el contenido y encuentra satisfacción en una red descentralizada de proveedores, que puede estar más abierta al contenido para adultos.
---
Dicho esto, para evitar el contenido *ilegal* todavía tenemos fuertes barandillas, como clasificadores constitucionales.
¿El Catch-22? Confiar en modelos externos para juzgar el contenido puede, en sí mismo, ser una violación de los Términos de servicio del proveedor. (Como ser enrutado automáticamente a los modelos secretos de OpenAI).
¿Quién lo está haciendo mejor? Anthropic mostró algunas capacidades realmente sólidas en su reciente hackathon de seguridad. ¿Quién más?
Experimento mental: ¿cómo descentralizaría la barandilla real mientras mantiene la privacidad del usuario?
Una idea sería tratarlo como un servicio de "mezcla": como Tornado Cash para contenido en lugar de monedas.
Tendrías varios nodos que reciben lotes de contenido para revisar, y usan pruebas ZK para dar fe de la calificación de contenido legal/ilegal + para cada uno de ellos, pero no conocen las fuentes.
Entonces la puerta de enlace podría rechazar el trabajo y proporcionar pruebas del "por qué" sin ser acusada de sesgo/censura innecesaria.
Entonces serían parte de una red incentivada en la capa de entrada.
Ejemplo: digamos que creé un envoltorio para sus credenciales de AWS con acceso a Bedrock Guardrails. Luego, por contribuir a la mezcla, pagamos una pequeña prima en ETH en Base, administrada, tal vez, por un servicio de coordinación de prototipos construido en @eigenlayer EigenCloud.
Luego, cualquiera podría unirse y distribuir la carga y la mezcla de contenido.
Necesito medir la latencia para esto.
1.77 K
3
El contenido al que estás accediendo se ofrece por terceros. A menos que se indique lo contrario, OKX no es autor de la información y no reclama ningún derecho de autor sobre los materiales. El contenido solo se proporciona con fines informativos y no representa las opiniones de OKX. No pretende ser un respaldo de ningún tipo y no debe ser considerado como un consejo de inversión o una solicitud para comprar o vender activos digitales. En la medida en que la IA generativa se utiliza para proporcionar resúmenes u otra información, dicho contenido generado por IA puede ser inexacto o incoherente. Lee el artículo enlazado para más detalles e información. OKX no es responsable del contenido alojado en sitios de terceros. Los holdings de activos digitales, incluidos stablecoins y NFT, suponen un alto nivel de riesgo y pueden fluctuar mucho. Debes considerar cuidadosamente si el trading o holding de activos digitales es adecuado para ti según tu situación financiera.