플래시스코어
페이지 정보
작성자 낭달웅동 작성일25-11-19 댓글0건관련링크
-
http://75.rsd536.top
0회 연결
-
http://53.rwp341.top
0회 연결
본문
바로가기 go !! 릴게임끝판왕 go !!
플래시스코어 하는방법!!
플래시스코어 게임은 카지노 게임 중 하나로, 플레이어가 "플래시스코어"와 "타이거" 중 어느 쪽이 승리할지를 예측하여 베팅하는 사다리 배팅방법게임입니다. 간단한 규칙과 전략을 가지고 있으며, 아래는 기본적인 파워볼 당첨금 게임 방법입니다:
베팅: major 토토사이트 게임이 시작되면 플레이어는 "플래시스코어(Dragon)"와 "타이거(Tiger)" 중 어느 쪽이 이길지를 선택하여 베팅합니다. 합법 파워볼게임 베팅 금액을 선택하고 베팅 영역에 베팅을 배치합니다.
국내 메이저사이트 분배: 딜러는 "플래시스코어"와 "타이거" 각각에게 1장의 카드를 나눠줍니다.
승패 결정: 플래시스코어 는 나눠진 안전사이트 중에 높은 숫자의 로우바둑이 전략 를 가진 쪽이 이깁니다. 토토사이트 도메인 Ace(1)이 가장 낮은 숫자이며, King(13)이 가장 높은 숫자입니다. 만약 두 카드의 숫자가 동일하면 무승부가 됩니다.
플래시스코어 결과 확인: 딜러가 파워볼 번호 를 오픈하여 결과를 확인합니다. 승리한 쪽에 안전토토사이트 놀 검소 베팅한 플레이어는 해당 베팅에 대한 배당금을 받습니다.
플래시스코어 게임 재개: 이후에 새로운 사다리 토토 게임이 시작되며, 플레이어는 다시 메이저놀이터 코드 을 할 수 있습니다.
주의할 점은 플래시스코어 에 따라 추가 규칙이나 사이드 베팅 옵션 등이 있을 수 있으니, 해당 플래시스코어 의 규칙을 참고하시기 바랍니다. 또한, 책임 있는 하하포커사이트 이 중요하며 자신의 한계를 인식하고 관리하는 것이 중요합니다.
플래시스코어 의 인기 이유!
플래시스코어 이 인기 있는 이유는 여러 가지가 있습니다:
간편한 게임성: 플래시스코어 은 규칙이 간단하고 이해하기 쉽습니다. 무료 포커 사이트 플레이어는 단순히 특정 숫자나 색상에 파워볼 조합배당 하면 되기 때문에 복잡한 전략이나 깊은 이해가 필요하지 않습니다.
빠른 결과: 에볼루션 용호 게임 결과가 상대적으로 빨리 나오는 특징이 있습니다. 플래시스코어 를 타고 있는 공이 내려오면서 승리자가 결정되므로, 긴장감을 유발하고 흥미를 높입니다.
다양한 배팅 옵션: 플래시스코어 은 다양한 배팅 옵션을 제공하여 플레이어가 선택할 수 있는 여지를 늘립니다. 파워볼게임 추천 숫자, 색상, 짝/홀 등 다양한 조합으로 릴게임 피싱 베팅할 수 있어서 플레이어들이 자유롭게 선택할 수 있습니다.
소셜 요소: 플래시스코어 은 보통 여러 명이 함께 즐기는 스포츠토토사이트 이기 때문에 소셜 요소가 있습니다. 함께 파워볼사이트 주소 베팅하고 결과를 기다리는 과정에서 친구나 가족과의 대화와 소통을 즐길 수 있습니다.
낮은 동행복권파워볼 하는법 배팅 금액: 일반적으로 플래시스코어 은 낮은 배팅 금액으로도 즐길 수 있습니다. 이로 인해 저량한 금액으로도 릴게임코리아 게임을 즐길 수 있어서 다양한 층위의 사람들이 쉽게 참여할 수 있습니다.
이러한 이유들로 인해 플래시스코어 은 다양한 층위의 사람들에게 인기가 있습니다. 그러나 파워볼 번호 게임임에도 불구하고 중독성과 재정적 위험에 대한 주의가 필요합니다. 항상 책임 있는 홀덤 배팅법 이 중요합니다.
플래시스코어 은 다양한 매력을 가지고 있습니다. 여기에는 다음과 같은 요인들이 포함될 수 있습니다:
긴장감과 불확실성: 플래시스코어 은 승패가 불확실한 상황에서 베팅을 하기 때문에 플레이앤고 슬롯 추천 을 높여줍니다. 이 불확실성은 파워볼 룰렛 게임을 더욱 흥미롭게 만들어주고, 승리에 대한 기대감을 증폭시킵니다.
스릴과 즐거움: 플래시스코어 은 승부욕과 승리에 대한 기대감을 자극하여 릴게임코리아 을 더욱 즐겁게 만들어줍니다. 파워볼 당첨 확률 승리의 기쁨과 패배의 아쉬움을 경험하면서 새로운 도전을 즐길 수 있습니다.
소셜 경험: 플래시스코어 은 종종 다른 사람들과 함께 즐기는 파워볼사이트 도메인 활동으로, 친구나 가족과의 연결을 증진시키는 데 도움이 될 수 있습니다. 불법 토토사이트 나 도박장에서는 다른 이들과의 대화와 함께 온라인파워볼 사이트 을 즐기는 것이 보편적입니다.
런닝볼홈페이지 보상: 플래시스코어 은 일정한 금전적 보상을 통해 승리에 대한 만족감을 주기도 합니다. 환수율좋은슬롯 한 경우에는 보너스나 파워볼 고액 하는곳 을 받게 되어 경제적 이득을 얻을 수 있습니다.
전략과 스킬: 일부 플래시스코어 게임은 전략과 스킬이 필요한 파워볼하기 좋은곳 요소를 포함하고 있어, 플레이어가 더욱 참여하고 집중할 수 있습니다. 전략적으로 하하포커사이트 을 플레이함으로써 승리 기회를 높일 수 있습니다.
그러나 플래시스코어 은 중독성이 있을 수 있고 재정적 위험을 초래할 수 있으므로, 책임 있는 플래시스코어 이 중요합니다. 항상 자신의 한계를 인식하고, 드래곤타이거 을 통제하는 것이 중요합니다.
플래시스코어이 주는 즐거움!
플래시스코어 은 많은 이들에게 즐거움과 기대감을 안겨주는 인기 안전놀이터 순위 게임입니다. 이 파워볼 숫자 합 이 주는 즐거움에는 여러 가지 측면이 있습니다.
플래시스코어 이루는 기회: 파워볼은 상당한 상금을 획득할 수 있는 기회를 제공합니다. 이를 통해 참가자들은 플래시스코어 을 이루고 삶을 변화시킬 수 있는 기회를 얻습니다. 당첨될 경우에 대한 기대와 플래시스코어은 많은 이에게 즐거움을 줍니다.
간편한 참여: 플래시스코어 은 복잡한 규칙이나 전략 없이 간단하게 참여할 수 있는 mgm 공식사이트 입니다. 로또 번호를 선택하고 추첨 결과를 기다리는 과정 자체가 즐거움을 줄 수 있습니다.
사회적 경험: 플래시스코어 은 가족, 친구, 동료들과 함께 참여하여 즐길 수 있는 로우바둑이 전략 입니다. 추첨일을 기다리며 번호를 선택하는 과정이나 홀덤 배팅법 여부에 대한 기대와 이야기는 사회적 상호작용을 촉진합니다.
꿈과 상상의 자유: 플래시스코어 에 참여하는 동안 참가자들은 당첨될 경우 어떻게 상금을 사용할지 상상할 수 있습니다. 새로운 집, 차, 여행, 비트코인 결제 혹은 꿈꾸던 일들을 이루는 상상은 즐거움과 희망을 안겨줍니다.
기대와 설렘: 추첨 타이거 카지노 를 기다리는 과정은 기대와 파워볼 번호추출기 을 안겨줍니다. 당첨 여부에 대한 기대감은 네임드speed6 참여자들에게 즐거움을 줄 뿐만 아니라 긴장감과 흥분도 높일 수 있습니다.
이처럼 플래시스코어은 간편하고 즐겁게 참여할 수 있는 무료 포커 사이트 게임으로, 많은 이들에게 즐거움과 희망을 제공합니다. 그러나 그래프 안전사이트 에 참여할 때는 항상 책임 있는 파워볼 고액전용 을 실천하고 예산을 관리하는 것이 중요합니다.
기자 admin@reelnara.info
(CG) [연합뉴스TV 제공]
(서울=연합뉴스) 구정모 기자 = 최근 연세대와 서울대에서 발생한 생성형 인공지능(AI) 사용 부정행위로 대학 내에서의 AI 부정 사용이 논란이 되고 있다.
특히 연세대의 경우 학생들에게 '자수'를 권고하는 방식으로 대응해 온라인 커뮤니티를 중심으로 "부정행위를 적발하지 못하니 자수를 유도하는 것 아니냐"는 이야기가 돌고 있다.
일각에선 "AI 탐지기의 정확도가 떨어진다", "우회 프로그램으로 얼마든지 피할 수 있다"는 의견도 나온다.
릴게임꽁머니 AI가 작성한 글인지 사람이 쓴 글인지 판별해준다는 'AI 생성 글 탐지기'(AI text detector)의 성능은 실제로 어느 정도인지 살펴봤다.
AI 규제 (PG) [강민지 제작] 일러스트
바다이야기#릴게임 "AI 탐지기, 회피 조작에 취약…부정 사용 적발에 쓸 수 없어"
결론부터 말하면 최근 나온 논문들은 AI 탐지기가 부정 사용을 적발하는 데 사용될 만큼 정확하지 않고 신뢰할 만하지도 않다는 연구 결과를 내놓고 있다.
필리핀 연구진이 2020∼2024년 AI 탐지기를 다룬 논문 34편을 검토해 발표한 논문 'AI 생성 글 릴게임예시 탐지기의 정확도와 신뢰성'(2025)에 따르면 대부분 AI 탐지기의 정확도가 50% 이상을 보였으나 탐지기별로 차이를 보였다.
유료 AI 탐지기가 무료보다 더 나은 성능을 보였다. 유료 AI 탐지의 정확도는 평균 87%였지만 가입이 필요 없는 AI 탐지기는 정확도가 77%에 그쳤다.
하지만 탐지 회피 기법을 도입하면 손오공릴게임예시 정확도는 대부분 급격하게 떨어졌다. 예컨대 다른 표현으로 바꾸기(paraphrasing)만 해도 정확도가 60% 이상 하락한 사례도 있었다.
또한 GPT-4로 생성된 자료보다 GPT-3.5로 생성된 자료를 탐지할 때 더 높은 정확도를 보였다.
이는 AI 탐지기의 정확도가 오래된 AI 모델에 대해선 효과적이지만 새로운 알라딘릴게임 모델에선 제대로 기능하지 못함을 의미했다.
논문은 이같은 문헌 검토 결과를 토대로 "AI 탐지기는 사용하기에 정확하지도 않고 신뢰할 만하지도 않다"며 "AI 탐지기의 능력에만 전적으로 의존해서는 안 된다"고 조언했다.
구체적인 테스트 결과를 확인하기 위해 국제학술지 '고등교육 교육공학 국제저널'(IJETHE)에 실린 논문 '생성형 AI 텍스트 감지기를 우회하는 간단한 기법'(2024)을 살펴봤다. 이 논문은 'AI 생성 글 탐지기의 정확도와 신뢰성' 논문이 검토 대상으로 삼았던 34편 중 하나다.
GPT-4 [오픈AI 홈페이지 캡처. 재판매 및 DB 금지]
마이크 퍼킨스 브리티시 유니버시티 베트남(BUV) 연구·혁신센터장 등 7명이 공저한 이 논문에 따르면 터닛인, GPT제로, 제로GPT, 카피리크스, 크로스플래그 등 AI 탐지기 7개의 평균 정확도는 39.5%에 불과했다.
테스트에는 GPT-4, 클로드2, 바드(현 제미나이) 등이 각각 5개씩 생성한 글 15개, 인간이 작성한 글 10개, AI 생성 글에 탐지 회피 기법을 적용한 글 89개 등 모두 114개가 표본으로 활용됐다.
AI 탐지기의 정확도는 이 중 AI 생성 글 15개를 대상으로 테스트한 결과다. 즉, AI 생성 글을 줬을 때 'AI가 쓴 글이다'라고 판정한 비율이 39.5%라는 의미다.
하지만 AI 탐지기를 속이기 위해 AI가 생성한 글들에 고의로 철자 오류를 삽입하거나 문장들의 길이를 들쭉날쭉하게 하는 등 탐지 회피 기법을 적용했더니 평균 정확도가 22.2%로 급감했다.
이 같은 결과는 탐지 회피 기법이 AI 탐지기가 AI 생성 글임을 판단하는 기준을 역이용하기 때문이다.
예컨대 AI는 인간과 달리 비교적 일관된 길이와 구조의 문장을 생성하는 경향이 있다. 이를 역이용해 문장 길이에 변화를 주면 AI 탐지기는 인간이 쓴 글로 착각하게 된다.
인공지능 챗봇 (PG) [강민지 제작] 일러스트
철자 오류도 마찬가지다. AI 생성 글에는 철자 오류가 사실상 없기 때문에 AI 탐지기는 철자 오류가 있는 글을 인간이 쓴 글로 판정한다.
AI 탐지기는 인간이 작성한 글 10개에 대해서도 인간이 쓴 글이라고 판정한 비율이 67%에 불과했다.
특히 인간이 작성했음에도 AI 생성 글로 잘못 판단한 오탐지율이 15%에 달했다.
논문은 "학생들이 학업윤리지침을 위반했는지를 판단하기 위한 목적으로 AI 탐지기를 활용하는 것을 권장할 수 없다"고 밝혔다.
인간이 쓴 글, AI 생성 글(탐지 회피 기법이 적용된 글 포함) 등 모든 표본을 대상으로 테스트했을 때 AI 생성 글임에도 탐지하지 못한 미탐지 비율이 평균 65.7%였다.
논문은 현세대 AI 탐지기는 정확도가 낮고, 탐지 회피 조작에 매우 취약해 학문적 부정행위 판단 도구로는 신뢰할 수 없다고 결론을 내렸다.
(CG) [연합뉴스TV 제공]
"영어 기반 AI 탐지 모델, 한국어에 적용하면 성능 급감"
AI 탐지기는 영어와 구조적·문법적 특성이 다른 한국어에 대해선 어떤 성능을 보일까.
'2024년 대한전자공학회 하계학술대회 논문집'에 실린 논문 '인공지능 생성 텍스트 탐지 기술의 한국어 적용'(박현주·김병준·김부근 중앙대 AI대학원)에 따르면, 영어 기반인 AI 탐지 모델을 한국어에 그대로 적용하면 성능이 급격하게 떨어지는 것으로 나타났다.
이 논문에선 디텍트GPT와 '적대적 학습 기반 AI 텍스트 탐지 모델'(RADAR)이라는 두 가지 AI 탐지 모델을 대상으로 GPT-3.5-터보와 클로드-3-소네트가 생성한 한국어 텍스트를 입력해 AI 생성 글인지 여부를 판단하게 했다.
그 결과 GPT-3.5가 생성한 글들에 대해서 디텍트GPT는 수용자조작특성곡선(AUROC) 값이 0.55∼0.65, RADAR는 0.40∼0.47을 기록했다.
AUROC 지표는 AI 생성 글과 인간이 쓴 글을 얼마나 잘 구분하는지 보여주는 점수로, 0~1 사이의 값을 갖는데, 1은 100% 확률로 맞춘다는 것을 의미한다.
0.5는 확률이 50%이므로 사실상 탐지기가 아무 쓸모가 없는 수준임을 나타낸다. 어떤 글이 AI 생성 글이거나 인간 글일 확률이 기본적으로 반반이므로, 어떤 글이 AI 생성 글일 확률이 50%라고 말하는 것은 누구나 할 수 있는 말이기 때문이다.
이 두 탐지 모델이 영어로 쓰인 글을 대상으로 했을 때 AUROC 값이 0.9 수준에 달했던 것과 비교하면 한국어 글에 대한 탐지 능력이 상당히 떨어진다고 할 수 있다.
클로드-3가 생성한 한국어 글에 대한 AUROC 값은 디텍트GPT가 0.43∼0.52, RADAR은 0.18∼0.38로 GPT-3.5보다 더 낮았다.
이는 클로드-3가 GPT-3.5보다 더 사람처럼 글을 자연스럽게 쓰기 때문에 그만큼 탐지가 안 된 것으로 풀이됐다.
특히 RADAR의 AUROC 값이 0.5보다 상당히 낮은데, 이는 동전 던지기로 결정해 맞추는 것보다 확률이 더 떨어진다는 것을 의미한다고 논문은 설명했다.
이 논문이 작성된 지난해 수준에선 AI 탐지 모델이 한국어에선 신뢰할 수 없음을 실험 결과가 보여준 셈이다.
구글의 차세대 대규모 언어모델 '제미나이' [구글 제공]
"모든 시험에 'AI 스트레트 테스트' 필요"
이처럼 현재 AI 탐지기로 AI 부정 사용을 적발하기 어렵다면 어떻게 학내 AI 부정 사용에 대처해야 할까.
영국의 민간 싱크탱크 고등교육정책연구소(HEPI)가 올 2월 발표한 '2025 생성형 AI 학생 활용 실태 조사'의 결과와 정책 제언을 참고로 할 만하다.
이 조사에서 영국의 대학생 1천41명을 대상으로 한 설문한 결과 어떤 식으로든 AI를 사용해봤다는 응답이 92%로, 작년 조사 때의 66%에서 급증했다.
특히 과제나 시험에 AI를 써봤다는 응답이 같은 기간 53%에서 88%로 뛰어올랐다. 18%는 AI가 생성한 글을 그대로 자신의 과제물에 포함했다고도 했다.
AI를 사용하는 이유로는 '시간을 절약하기 위해서'(51%), '내 과제물의 질을 개선하기 위해서'(50%)라고 밝혔다.
HEPI는 모든 시험·평가에 대해 챗GPT 유로 버전과 같이 강력한 AI를 활용해 문제가 너무 쉽게 풀리지는 않는지 확인하는 '스트레스 테스트'를 실시해야 한다고 조언했다.
학생들이 교과 과정에 성실히 참여하지 않고도 AI를 활용해 높은 점수를 받을 수 있다면 그런 시험 또는 평가는 과감하게 다시 설계해야 한다고 강조했다.
그러면서 대학이 AI 교육에 적극적으로 나서지 않는다면 AI를 잘 다루는 학생과 그렇지 못한 학생 간 '디지털 격차'를 더 확대할 것이라고 경고했다.
pseudojm@yna.co.kr
<<연합뉴스 팩트체크부는 팩트체크 소재에 대한 독자들의 제안을 받고 있습니다. 이메일(factcheck@yna.co.kr)로 제안해 주시면 됩니다.>>
▶제보는 카톡 okjebo
(서울=연합뉴스) 구정모 기자 = 최근 연세대와 서울대에서 발생한 생성형 인공지능(AI) 사용 부정행위로 대학 내에서의 AI 부정 사용이 논란이 되고 있다.
특히 연세대의 경우 학생들에게 '자수'를 권고하는 방식으로 대응해 온라인 커뮤니티를 중심으로 "부정행위를 적발하지 못하니 자수를 유도하는 것 아니냐"는 이야기가 돌고 있다.
일각에선 "AI 탐지기의 정확도가 떨어진다", "우회 프로그램으로 얼마든지 피할 수 있다"는 의견도 나온다.
릴게임꽁머니 AI가 작성한 글인지 사람이 쓴 글인지 판별해준다는 'AI 생성 글 탐지기'(AI text detector)의 성능은 실제로 어느 정도인지 살펴봤다.
AI 규제 (PG) [강민지 제작] 일러스트
바다이야기#릴게임 "AI 탐지기, 회피 조작에 취약…부정 사용 적발에 쓸 수 없어"
결론부터 말하면 최근 나온 논문들은 AI 탐지기가 부정 사용을 적발하는 데 사용될 만큼 정확하지 않고 신뢰할 만하지도 않다는 연구 결과를 내놓고 있다.
필리핀 연구진이 2020∼2024년 AI 탐지기를 다룬 논문 34편을 검토해 발표한 논문 'AI 생성 글 릴게임예시 탐지기의 정확도와 신뢰성'(2025)에 따르면 대부분 AI 탐지기의 정확도가 50% 이상을 보였으나 탐지기별로 차이를 보였다.
유료 AI 탐지기가 무료보다 더 나은 성능을 보였다. 유료 AI 탐지의 정확도는 평균 87%였지만 가입이 필요 없는 AI 탐지기는 정확도가 77%에 그쳤다.
하지만 탐지 회피 기법을 도입하면 손오공릴게임예시 정확도는 대부분 급격하게 떨어졌다. 예컨대 다른 표현으로 바꾸기(paraphrasing)만 해도 정확도가 60% 이상 하락한 사례도 있었다.
또한 GPT-4로 생성된 자료보다 GPT-3.5로 생성된 자료를 탐지할 때 더 높은 정확도를 보였다.
이는 AI 탐지기의 정확도가 오래된 AI 모델에 대해선 효과적이지만 새로운 알라딘릴게임 모델에선 제대로 기능하지 못함을 의미했다.
논문은 이같은 문헌 검토 결과를 토대로 "AI 탐지기는 사용하기에 정확하지도 않고 신뢰할 만하지도 않다"며 "AI 탐지기의 능력에만 전적으로 의존해서는 안 된다"고 조언했다.
구체적인 테스트 결과를 확인하기 위해 국제학술지 '고등교육 교육공학 국제저널'(IJETHE)에 실린 논문 '생성형 AI 텍스트 감지기를 우회하는 간단한 기법'(2024)을 살펴봤다. 이 논문은 'AI 생성 글 탐지기의 정확도와 신뢰성' 논문이 검토 대상으로 삼았던 34편 중 하나다.
GPT-4 [오픈AI 홈페이지 캡처. 재판매 및 DB 금지]
마이크 퍼킨스 브리티시 유니버시티 베트남(BUV) 연구·혁신센터장 등 7명이 공저한 이 논문에 따르면 터닛인, GPT제로, 제로GPT, 카피리크스, 크로스플래그 등 AI 탐지기 7개의 평균 정확도는 39.5%에 불과했다.
테스트에는 GPT-4, 클로드2, 바드(현 제미나이) 등이 각각 5개씩 생성한 글 15개, 인간이 작성한 글 10개, AI 생성 글에 탐지 회피 기법을 적용한 글 89개 등 모두 114개가 표본으로 활용됐다.
AI 탐지기의 정확도는 이 중 AI 생성 글 15개를 대상으로 테스트한 결과다. 즉, AI 생성 글을 줬을 때 'AI가 쓴 글이다'라고 판정한 비율이 39.5%라는 의미다.
하지만 AI 탐지기를 속이기 위해 AI가 생성한 글들에 고의로 철자 오류를 삽입하거나 문장들의 길이를 들쭉날쭉하게 하는 등 탐지 회피 기법을 적용했더니 평균 정확도가 22.2%로 급감했다.
이 같은 결과는 탐지 회피 기법이 AI 탐지기가 AI 생성 글임을 판단하는 기준을 역이용하기 때문이다.
예컨대 AI는 인간과 달리 비교적 일관된 길이와 구조의 문장을 생성하는 경향이 있다. 이를 역이용해 문장 길이에 변화를 주면 AI 탐지기는 인간이 쓴 글로 착각하게 된다.
인공지능 챗봇 (PG) [강민지 제작] 일러스트
철자 오류도 마찬가지다. AI 생성 글에는 철자 오류가 사실상 없기 때문에 AI 탐지기는 철자 오류가 있는 글을 인간이 쓴 글로 판정한다.
AI 탐지기는 인간이 작성한 글 10개에 대해서도 인간이 쓴 글이라고 판정한 비율이 67%에 불과했다.
특히 인간이 작성했음에도 AI 생성 글로 잘못 판단한 오탐지율이 15%에 달했다.
논문은 "학생들이 학업윤리지침을 위반했는지를 판단하기 위한 목적으로 AI 탐지기를 활용하는 것을 권장할 수 없다"고 밝혔다.
인간이 쓴 글, AI 생성 글(탐지 회피 기법이 적용된 글 포함) 등 모든 표본을 대상으로 테스트했을 때 AI 생성 글임에도 탐지하지 못한 미탐지 비율이 평균 65.7%였다.
논문은 현세대 AI 탐지기는 정확도가 낮고, 탐지 회피 조작에 매우 취약해 학문적 부정행위 판단 도구로는 신뢰할 수 없다고 결론을 내렸다.
(CG) [연합뉴스TV 제공]
"영어 기반 AI 탐지 모델, 한국어에 적용하면 성능 급감"
AI 탐지기는 영어와 구조적·문법적 특성이 다른 한국어에 대해선 어떤 성능을 보일까.
'2024년 대한전자공학회 하계학술대회 논문집'에 실린 논문 '인공지능 생성 텍스트 탐지 기술의 한국어 적용'(박현주·김병준·김부근 중앙대 AI대학원)에 따르면, 영어 기반인 AI 탐지 모델을 한국어에 그대로 적용하면 성능이 급격하게 떨어지는 것으로 나타났다.
이 논문에선 디텍트GPT와 '적대적 학습 기반 AI 텍스트 탐지 모델'(RADAR)이라는 두 가지 AI 탐지 모델을 대상으로 GPT-3.5-터보와 클로드-3-소네트가 생성한 한국어 텍스트를 입력해 AI 생성 글인지 여부를 판단하게 했다.
그 결과 GPT-3.5가 생성한 글들에 대해서 디텍트GPT는 수용자조작특성곡선(AUROC) 값이 0.55∼0.65, RADAR는 0.40∼0.47을 기록했다.
AUROC 지표는 AI 생성 글과 인간이 쓴 글을 얼마나 잘 구분하는지 보여주는 점수로, 0~1 사이의 값을 갖는데, 1은 100% 확률로 맞춘다는 것을 의미한다.
0.5는 확률이 50%이므로 사실상 탐지기가 아무 쓸모가 없는 수준임을 나타낸다. 어떤 글이 AI 생성 글이거나 인간 글일 확률이 기본적으로 반반이므로, 어떤 글이 AI 생성 글일 확률이 50%라고 말하는 것은 누구나 할 수 있는 말이기 때문이다.
이 두 탐지 모델이 영어로 쓰인 글을 대상으로 했을 때 AUROC 값이 0.9 수준에 달했던 것과 비교하면 한국어 글에 대한 탐지 능력이 상당히 떨어진다고 할 수 있다.
클로드-3가 생성한 한국어 글에 대한 AUROC 값은 디텍트GPT가 0.43∼0.52, RADAR은 0.18∼0.38로 GPT-3.5보다 더 낮았다.
이는 클로드-3가 GPT-3.5보다 더 사람처럼 글을 자연스럽게 쓰기 때문에 그만큼 탐지가 안 된 것으로 풀이됐다.
특히 RADAR의 AUROC 값이 0.5보다 상당히 낮은데, 이는 동전 던지기로 결정해 맞추는 것보다 확률이 더 떨어진다는 것을 의미한다고 논문은 설명했다.
이 논문이 작성된 지난해 수준에선 AI 탐지 모델이 한국어에선 신뢰할 수 없음을 실험 결과가 보여준 셈이다.
구글의 차세대 대규모 언어모델 '제미나이' [구글 제공]
"모든 시험에 'AI 스트레트 테스트' 필요"
이처럼 현재 AI 탐지기로 AI 부정 사용을 적발하기 어렵다면 어떻게 학내 AI 부정 사용에 대처해야 할까.
영국의 민간 싱크탱크 고등교육정책연구소(HEPI)가 올 2월 발표한 '2025 생성형 AI 학생 활용 실태 조사'의 결과와 정책 제언을 참고로 할 만하다.
이 조사에서 영국의 대학생 1천41명을 대상으로 한 설문한 결과 어떤 식으로든 AI를 사용해봤다는 응답이 92%로, 작년 조사 때의 66%에서 급증했다.
특히 과제나 시험에 AI를 써봤다는 응답이 같은 기간 53%에서 88%로 뛰어올랐다. 18%는 AI가 생성한 글을 그대로 자신의 과제물에 포함했다고도 했다.
AI를 사용하는 이유로는 '시간을 절약하기 위해서'(51%), '내 과제물의 질을 개선하기 위해서'(50%)라고 밝혔다.
HEPI는 모든 시험·평가에 대해 챗GPT 유로 버전과 같이 강력한 AI를 활용해 문제가 너무 쉽게 풀리지는 않는지 확인하는 '스트레스 테스트'를 실시해야 한다고 조언했다.
학생들이 교과 과정에 성실히 참여하지 않고도 AI를 활용해 높은 점수를 받을 수 있다면 그런 시험 또는 평가는 과감하게 다시 설계해야 한다고 강조했다.
그러면서 대학이 AI 교육에 적극적으로 나서지 않는다면 AI를 잘 다루는 학생과 그렇지 못한 학생 간 '디지털 격차'를 더 확대할 것이라고 경고했다.
pseudojm@yna.co.kr
<<연합뉴스 팩트체크부는 팩트체크 소재에 대한 독자들의 제안을 받고 있습니다. 이메일(factcheck@yna.co.kr)로 제안해 주시면 됩니다.>>
▶제보는 카톡 okjebo