Policy Puppetry Prompt Injection

carmelo.daniele@gmail.com (Me) — Thu, 15 May 2025 00:00:00 +0200

Policy Puppetry Prompt Injection

Qualche giorno fa ho fatto qualche esperimento con alcune tecniche di Jailbraking, che condivido nel repo. Sono partito da un articolo di HiddenLayer, di qualche settimana fa, in cui il team di ricerca ha pubblicato un articolo che descrive una tecnica piuttosto creativa e ingegnosa di jailbreaking, per bypassare i safety guardails e l’allineamento dei modelli di frontiera. La tecnica sembra essere universale ed applicabile con un singolo prompt a più modelli ed è in grado di mostrare contenuti tipicamente non safety o addirittura mostrare porzioni del system prompt nativo.

Langchain pt. 3 - Come invocare API Rest in linguaggio naturale

carmelo.daniele@gmail.com (Me) — Sat, 20 Apr 2024 19:00:00 +0200

Intro

L’anno scorso, Gartner ha inserito la Generative AI nella fase di picco di aspettative all’interno del suo modello di Hype Cycle per il mondo della AI.

Recentemente alcuni nomi importanti tra le grandi aziende del settore hanno paragonato l’entusiasmo della GenAI alla bolla dotcom. Inoltre sono circolate delle indiscrezioni intorno ai principali Cloud Providers, secondo le quali essi stiano addirittura dando indicazioni ai loro Sales Team di rallentare l’entusiasmo dimostrato verso i clienti nei confronti delle iniziative di GenAI, o comunque di utilizzare un approccio cauto e consapevole dei costi e dei reali benefici. E’ già iniziata la discesa verso la “fossa della disillusione”?

Swagger on Cdani's Blog

Policy Puppetry Prompt Injection

Policy Puppetry Prompt Injection

Langchain pt. 3 - Come invocare API Rest in linguaggio naturale

Intro