Reddit, 폭롬에 대항하기 위한 AI 안전 필터 도입

새롭게 시행된 괴롭힘 필터는 이전에 신고된 자료를 사용하여 훈련되었습니다.


Reddit launches AI tool to detect online harassment.

🔗 Source: Reddit AI Safety Filter

Reddit, the popular online platform for communities and discussions, has recently rolled out an AI-powered safety filter to help combat harassing and objectionable content. This “harassment filter” is a significant step towards making Reddit a safer space for its users. 🚀

How Does the AI-Powered Safety Filter Work?

According to Reddit, the filter utilizes a technology called Large Language Model (LLM), trained on moderator actions and the content removed by Reddit’s internal tools and enforcement teams. In other words, it has learned from the experiences of human moderators and is ready to lend a digital helping hand. 🤖💪

When a community and its moderators activate the filter, a new flag will appear in the mod queue, marking content that has been flagged as “potential harassment.” The moderators can then review and either approve or remove the content, providing feedback to Reddit on its accuracy. This collaborative effort empowers both humans and AI to maintain a safe online environment. 👥🔒

Why Is the Harassment Filter Important?

Moderating online communities can be an overwhelming task. Reddit’s dedicated team of moderators faces the daunting challenge of keeping the platform free from abusive and harmful content. With the introduction of the AI-powered filter, Reddit aims to lighten their load and enhance their ability to identify and address problematic posts and comments. 💪🛡️

This innovative tool complements the existing Modmail Harassment Filter, which acts as a “spam” folder for potentially abusive content in moderator messages. Now, with an extended scope covering posts and comments, the safety filter offers an additional layer of protection for Reddit’s users and preserves the platform’s integrity. 📩🔒

How to Set Up Reddit’s Harassment Filter

Configuring the harassment filter for your community is a breeze! Just follow these simple steps:

  1. Desktop Users: Go to the About Community tab on the right sidebar and select Mod Tools. 🖥️ iOS and Android Users: Click on the Mod Tools button below your community’s banner.

  2. Navigate to the Moderation section and click on Safety.

  3. Choose the Harassment filter option and toggle it on. 🎚️

  4. Decide between the Low or High filter options. The Low option blocks the minimum amount of content, but boasts higher accuracy in detecting harassment. On the other hand, the High option performs a broader sweep, blocking more posts. Reddit advises using the High option if your community encounters a significant amount of harassing content. ⚠️

Reddit will continue to automatically remove posts that explicitly violate its Content Policy. The harassment filter, however, gives communities the ability to manage objectionable content that might adhere to the policy but still raise concerns. This fine-grained control promises a safer and more inclusive Reddit experience. 🌟✨

Digging Deeper into Reddit’s Recent Advancements

The introduction of the AI-powered safety filter adds to the list of recent improvements and updates made by Reddit. The platform has been on a roll, with the anticipation of its stock market debut this month. Stay tuned as Reddit continues to enhance its features and experiences to better serve its vibrant community! 🚀🎉

To learn more about Reddit’s commitment to safety and new developments, check out these insightful articles:

  1. New reports link Meta and ‘momfluencers’ in perpetuating child exploitation online
  2. Deepfake ads featuring Jenna Ortega ran on Meta platforms. Big Tech needs to fight this.
  3. ACLU warns against proposed TikTok ban for violating the First Amendment
  4. Google Search is trying to tackle ‘low-quality’ content
  5. OpenAI shares Elon Musk’s emails, says he wanted ‘full control’ of the company


💬 독자 질문에 대한 답변

Q: 괴롭힘 필터는 모든 불쾌한 콘텐츠를 완전히 제거할 수 있나요? A: 괴롭힘 필터는 부적절한 콘텐츠의 식별 및 처리를 크게 향상시키지만, 어떤 시스템도 완벽하지 않습니다. Reddit의 인공지능은 거짓 양성을 최소화하고 잠재적으로 해로운 콘텐츠를 효과적으로 강조하는 균형을 맞추려고 합니다. 사용자 피드백은 AI 모델을 훈련하고 개선하는 데 중요한 역할을 합니다.

Q: Reddit가 필터가 합법적인 토론을 억제하지 않도록 어떻게 보장할 수 있나요? A: Reddit는 이 우려를 인지하고 있으며, 이것이 Low 및 High 필터 옵션을 제공하는 이유입니다. Low 옵션은 정확성을 우선시하고, High 옵션은 더 넓은 범위를 취합니다. 잘못으로 표시될 수 있는 콘텐츠는 관리자가 검토하고 Reddit로 돌려보고 지속적인 개선을 위해 보고할 수 있습니다.

Q: Reddit는 안전한 환경을 보장하기 위해 어떤 다른 노력을 하고 있나요? A: 괴롭힘 필터 외에도 Reddit는 다양한 안전 조치에 적극적으로 노력하고 있습니다. 이 조치에는 콘텐츠 정책 보고 시스템, 커뮤니티 보상 보고서 및 포괄적인 안티-악의적 운영 팀이 포함됩니다. Reddit는 계속해서 개선하고 안전 문제에 대해 커뮤니티와 협력하기로 했습니다.

온라인 안전 보장을 위한 AI의 미래

Reddit의 AI 기반 안전 필터는 온라인 괴롭힘에 대항하는 중요한 한걸음입니다. AI 기술이 계속 발전함에 따라, 관리자를 지원하고 더 안전한 디지털 공간을 만들기 위한 더욱 정교한 도구가 나올 것으로 기대됩니다. 이 긍정적인 발전을 축하하고 더 밝은 온라인 미래를 위해 계속 노력합시다! 🌐🤖💙

이 글이 마음에 드셨나요? 친구들과 공유하여 Reddit의 AI 기반 안전 필터에 대해 알리세요! 📣💻

컴퓨터 기술과 프로그래밍에 대한 더 매력적인 콘텐츠를 위해 팔로우해주세요! 🌟😃✍️

🔗 참고 자료: – Reddit AI Safety Filter새 보고서, Meta 및 ‘맘플루언서’가 온라인 아동학대를 지속한다고 결론Jenna Ortega가 출연한 Meta 플랫폼에서 실행된 딥페이크 광고. 대형 기술 기업이 이를 bekjempe해야 합니다.ACLU가 제안된 TikTok 금지에 대한 첫 번째 수정안을 준수하지 않다고 경계Google 검색이 ‘저품질’ 콘텐츠와 싸우기 시작 중OpenAI는 Elon Musk의 이메일을 공개, ‘그가 회사의 ‘완전한 통제’를 원했다’고 주장
