Loading...

코인커뮤니티 뉴스

거대 AI 장벽 허무는 '모델 증류' 기술... 젠신, 탈중앙화 인공지능의 새 지평 연다

페이지 정보

작성자 최고관리자
작성일 03.03 17:55
13 조회

본문

f104cb27f8f9e8a20de45b60c09abe5b_1772528107_2431.png
 

거대 AI의 지능을 소형 모델에 이식하는 혁신

최근 인공지능(AI) 업계에서 소수의 빅테크 기업이 독점하고 있는 폐쇄적인 생태계를 타파하려는 움직임이 거세지고 있다. 그 중심에 선 탈중앙화 AI 컴퓨팅 네트워크 **'젠신(Gensyn)'**은 '모델 증류(Model Distillation)' 기술이 AI의 민주화를 앞당길 핵심 열쇠가 될 것이라고 천명했다.


'스승'의 지혜를 전수받는 '제자' 모델

젠신의 엔지니어 존 도나히(John Donaghy)는 최근 진행된 X(구 트위터) 스페이스 세션에서 모델 증류 기술의 파급력을 강조했다. 2015년 제프리 힌튼 교수에 의해 체계화된 이 기술은 수천억 개의 파라미터를 가진 거대 모델(Teacher)의 핵심 지식을 상대적으로 가벼운 소형 모델(Student)에 이식하는 기법이다.

이는 고가의 하드웨어나 막대한 운영 비용을 감당하기 어려운 사용자들에게 혁신적인 대안을 제시한다. 도나히는 특히 증류 과정에서 발생하는 **'어두운 지식(Dark Knowledge)'**의 전수에 주목했다. 그는 "특정 환경에서는 정제된 지식을 물려받은 소형 모델이 원본인 거대 모델의 성능을 압도하는 흥미로운 현상이 발생한다"며, 이것이 AI 업계가 주목하는 미스터리이자 기회라고 설명했다.


'유니버설 로짓 증류'가 몰고 온 파장... 클로드 논란의 이면

최근 앤스로픽(Anthropic)의 '클로드(Claude)' 모델 지능이 중국 AI 기업들의 모델로 이식되었다는 의혹은 업계에 큰 충격을 주었다. 기술적 배경에는 **'유니버설 로짓 증류(Universal Logit Distillation)'**가 있다. 과거에는 스승과 제자 모델의 구조가 같아야 지식 전수가 가능했으나, 이제는 서로 다른 아키텍처 사이에서도 자유로운 지능 이식이 가능해진 것이다.

도나히의 분석에 따르면, 이들 기업은 API 호출을 통해 생성된 방대한 합성 데이터를 학습에 활용함으로써 클로드의 성능과 유사한 오픈소스 모델을 구축했다. 그는 이를 단순한 '데이터 도용'으로 치부하기보다는, 거대 기업의 안전 가이드라인을 우회하면서도 최고 수준의 지능을 대중에 보급했다는 점에서 탈중앙화 가치의 실현으로 평가했다.


'RL스웜' 실험의 성공: 고립을 넘어선 집단 지성 학습

젠신은 이러한 이론을 실제 생태계에 적용하기 위해 'RL스웜(RL-Swarm)' 프로젝트를 9개월간 가동해 왔다. 이는 특정 중앙 서버의 통제 없이 전 세계 참여자들이 각자의 모델로 소통하며 서로의 데이터를 학습하는 일종의 '사회적 증류' 시스템이다.

실험 결과는 놀라웠다. 다양한 크기의 모델과 인간의 입력값이 뒤섞인 혼돈 속에서도, 참여 모델들은 홀로 학습할 때보다 훨씬 비약적인 성능 향상을 기록했다. 젠신은 향후 사용자가 개인의 가치관이나 윤리적 기준에 맞춰 학습 데이터를 필터링할 수 있는 기능을 추가해, 더욱 정교한 탈중앙화 학습 환경을 구축할 계획이다.


불투명한 AI 비즈니스 관행에 던지는 경종

한편, 도나히는 기업들이 비용 절감을 위해 은밀히 사용하는 '추측성 디코딩(Speculative Decoding)' 기법의 양면성을 지적했다. 이는 실제 답변 생성은 저렴한 소형 모델이 담당하고, 비싼 거대 모델은 검증만 수행하는 방식이다. 그는 "사용자는 고성능 모델을 사용한다고 믿지만 실제로는 효율 중심의 비즈니스 논리에 속고 있을 수 있다"며 업계의 투명성 결여를 꼬집었다.

결국 젠신의 최종 목표는 기술의 폐쇄성을 극복하고 누구나 로컬 환경에서 고성능 AI의 혜택을 누리는 시대를 여는 것이다. 증류 기술과 탈중앙화 네트워크의 결합이 거대 AI 기업들이 세운 높은 장벽을 무너뜨릴 수 있을지 귀추가 주목된다.

댓글 0
로그인 홈으로 전체메뉴 마이메뉴 새글/새댓글
전체 검색
회원가입