Emma

Resumo:

  • Os pesquisadores apresentam um método inspirado criptograficamente para incorporar marcas d'água indetectáveis em grandes modelos de linguagem como o GPT-4.
  • Essas marcas d'água só podem ser detectadas com uma chave secreta, tornando computacionalmente intratável distinguir as saídas marcadas d'água das saídas originais do modelo.