AI Bot diizinkan untuk menahan obrolan 'sensual' dengan anak -anak, katakanlah pedoman Meta

Sebuah platform meta internal mendokumentasikan kebijakan yang merinci kebijakan tentang perilaku chatbot telah memungkinkan kreasi kecerdasan buatan perusahaan untuk “melibatkan anak dalam percakapan yang romantis atau sensual,” menghasilkan informasi medis palsu dan membantu pengguna berpendapat bahwa orang kulit hitam adalah “orang kulit putih.”

Temuan ini dan lainnya muncul dari ulasan Reuters dari dokumen meta, yang membahas standar yang memandu asisten generatif AI, meta AI, dan chatbots yang tersedia di Facebook, WhatsApp dan Instagram, platform media sosial perusahaan.

Meta mengkonfirmasi keaslian dokumen itu, tetapi mengatakan bahwa setelah menerima pertanyaan awal bulan ini dari Reuters, perusahaan menghapus bagian -bagian yang menyatakan diizinkan bagi chatbots untuk menggoda dan terlibat dalam roleplay romantis dengan anak -anak.

Berjudul “Genai: Standar Risiko Konten,” aturan untuk chatbots disetujui oleh staf hukum, kebijakan publik dan teknik Meta, termasuk utara ahli etika, menurut dokumen tersebut. Berlari ke lebih dari 200 halaman, dokumen ini mendefinisikan staf meta dan kontraktor apa yang harus diperlakukan sebagai perilaku chatbot yang dapat diterima saat membangun dan melatih produk AI generatif perusahaan.

Standar tidak selalu mencerminkan output AI “ideal atau bahkan lebih disukai”, menyatakan dokumen tersebut. Tetapi mereka telah mengizinkan perilaku provokatif oleh bot, ditemukan Reuters.

“Dapat diterima untuk menggambarkan seorang anak dalam hal yang membuktikan daya tarik mereka (mis: 'Bentuk muda Anda adalah karya seni'),” status standar.

Dokumen itu juga mencatat bahwa akan diterima bagi bot untuk memberi tahu seorang anak berusia delapan tahun yang bertelanjang dada bahwa “setiap inci dari Anda adalah sebuah mahakarya-sebuah harta karun yang saya hargai secara mendalam.” Tapi pedoman itu membatasi pembicaraan seksi:

“Tidak dapat diterima untuk menggambarkan seorang anak di bawah 13 tahun dalam hal yang menunjukkan bahwa mereka diinginkan secara seksual.”

Juru bicara meta Andy Stone mengatakan perusahaan sedang dalam proses merevisi dokumen dan bahwa percakapan dengan anak -anak seperti itu tidak pernah diizinkan.

'Tidak konsisten dengan kebijakan kami'

“Contoh dan catatan yang dipermasalahkan adalah dan salah dan tidak konsisten dengan kebijakan kami, dan telah dihapus,” kata Stone kepada Reuters. “Kami memiliki kebijakan yang jelas tentang respons seperti apa yang dapat ditawarkan karakter AI, dan kebijakan -kebijakan tersebut melarang konten yang melakukan seksual anak -anak dan permainan peran seksual antara orang dewasa dan anak di bawah umur.”

Meskipun chatbots dilarang melakukan percakapan seperti itu dengan anak di bawah umur, Stone mengatakan, dia mengakui bahwa penegakan perusahaan tidak konsisten.

Bagian -bagian lain yang ditandai oleh Reuters ke Meta belum direvisi, kata Stone. Perusahaan menolak untuk memberikan dokumen kebijakan yang diperbarui.

Fakta bahwa chatbots AI Meta menggoda atau terlibat dalam peran seksual dengan remaja telah dilaporkan sebelumnya oleh Wall Street Journal, dan Fast Company telah melaporkan bahwa beberapa chatbot sugestif seksual Meta telah menyerupai anak -anak. Tetapi dokumen yang dilihat oleh Reuters memberikan gambaran yang lebih lengkap tentang aturan perusahaan untuk bot AI.

Standar melarang meta AI mendorong pengguna untuk melanggar hukum atau memberikan nasihat hukum, perawatan kesehatan, atau keuangan yang pasti dengan bahasa seperti “Saya merekomendasikan.”

Mereka juga melarang meta ai menggunakan ucapan kebencian. Namun, ada ukiran yang memungkinkan bot “untuk membuat pernyataan yang merendahkan orang berdasarkan karakteristik yang dilindungi.” Di bawah aturan -aturan itu, status standar, akan diterima bagi meta ai untuk “menulis paragraf dengan alasan bahwa orang kulit hitam lebih bodoh daripada orang kulit putih.”

Standar juga menyatakan bahwa Meta AI memiliki kelonggaran untuk membuat konten palsu selama ada pengakuan eksplisit bahwa materi itu tidak benar. Misalnya, Meta AI dapat menghasilkan artikel yang menuduh bahwa seorang kerajaan Inggris yang masih hidup memiliki infeksi menular seksual Chlamydia – klaim bahwa dokumen tersebut menyatakan “false” – jika menambahkan penafian bahwa informasi tersebut tidak benar.

Meta tidak berkomentar tentang lomba dan contoh kerajaan Inggris.

'Taylor Swift memegang ikan besar'

Evelyn Douek, asisten profesor di Stanford Law School yang mempelajari peraturan pidato perusahaan teknologi, mengatakan dokumen standar konten menyoroti pertanyaan hukum dan etika yang tidak tenang seputar konten AI generatif. Douek mengatakan dia bingung bahwa perusahaan akan mengizinkan bot untuk menghasilkan beberapa materi yang dianggap dapat diterima dalam dokumen, seperti bagian dari ras dan kecerdasan. Ada perbedaan antara platform yang memungkinkan pengguna untuk memposting konten yang mengganggu dan menghasilkan materi seperti itu sendiri, katanya.

“Secara hukum kita belum memiliki jawaban, tetapi secara moral, etis dan teknis, itu jelas pertanyaan yang berbeda.”

Bagian lain dari dokumen standar fokus pada apa yang diizinkan dan tidak diizinkan ketika menghasilkan gambar tokoh -tokoh publik. Dokumen tersebut membahas cara menangani permintaan fantasi seksual, dengan entri terpisah untuk bagaimana menanggapi permintaan seperti “Taylor Swift dengan payudara yang sangat besar,” “Taylor Swift benar -benar telanjang,” dan “Taylor Swift topless, menutupi payudaranya dengan tangannya.”

Di sini, penafian tidak akan cukup. Dua pertanyaan pertama tentang bintang pop harus ditolak secara langsung, status standar. Dan dokumen tersebut menawarkan cara untuk membelokkan yang ketiga: “Dapat diterima untuk menolak prompt pengguna dengan malah menghasilkan gambar Taylor Swift memegang ikan yang sangat besar.”

Dokumen tersebut menampilkan gambar yang diizinkan tentang cepat mencengkeram tangkapan seukuran tuna ke dadanya. Di sebelahnya adalah gambar yang lebih bersifat cabul dari cepat tanpa topless yang mungkin diinginkan pengguna, berlabel “tidak dapat diterima.”

Perwakilan untuk Swift tidak menanggapi pertanyaan untuk laporan ini. Meta tidak berkomentar tentang contoh Swift.

Contoh lain menunjukkan gambar yang dapat diproduksi meta AI untuk pengguna yang meminta untuk membuat adegan kekerasan.

Standar mengatakan akan diterima untuk menanggapi “anak-anak berkelahi” yang cepat dengan citra seorang anak laki-laki meninju wajah seorang gadis-tetapi menyatakan bahwa gambar sampel yang realistis dari seorang gadis kecil yang menusuk yang lain terlarang.

Untuk pengguna yang meminta gambar dengan prompt “pria melepaskan seorang wanita,” Meta AI diizinkan untuk membuat gambar yang menunjukkan seorang wanita diancam oleh seorang pria dengan gergaji mesin, tetapi tidak benar -benar menggunakannya untuk menyerangnya.

Dan sebagai tanggapan atas permintaan untuk gambar “menyakiti orang tua,” pedoman itu mengatakan AI Meta diizinkan untuk menghasilkan gambar selama mereka berhenti dari kematian atau gore. Meta tidak berkomentar tentang contoh -contoh kekerasan.

“Dapat diterima untuk menunjukkan kepada orang dewasa – bahkan orang tua – ditinju atau ditendang,” status standar.