2024.05.22 (수)

  • 맑음속초18.8℃
  • 구름조금21.4℃
  • 구름많음철원18.5℃
  • 구름많음동두천18.8℃
  • 흐림파주17.2℃
  • 구름조금대관령20.6℃
  • 구름조금춘천21.6℃
  • 박무백령도13.9℃
  • 맑음북강릉21.0℃
  • 맑음강릉22.3℃
  • 맑음동해21.2℃
  • 박무서울20.6℃
  • 구름많음인천17.1℃
  • 구름많음원주21.8℃
  • 구름많음울릉도16.6℃
  • 박무수원18.0℃
  • 구름조금영월20.4℃
  • 구름많음충주22.7℃
  • 구름많음서산19.7℃
  • 구름많음울진18.2℃
  • 구름조금청주22.6℃
  • 맑음대전23.0℃
  • 맑음추풍령21.5℃
  • 맑음안동18.9℃
  • 구름조금상주19.2℃
  • 맑음포항21.1℃
  • 맑음군산20.5℃
  • 구름많음대구20.6℃
  • 맑음전주23.2℃
  • 구름많음울산20.0℃
  • 구름많음창원22.1℃
  • 구름많음광주22.9℃
  • 구름많음부산20.9℃
  • 흐림통영19.9℃
  • 구름많음목포21.7℃
  • 구름많음여수19.6℃
  • 흐림흑산도18.7℃
  • 구름많음완도22.3℃
  • 구름많음고창
  • 구름많음순천21.3℃
  • 박무홍성(예)19.5℃
  • 맑음20.4℃
  • 흐림제주20.6℃
  • 흐림고산20.0℃
  • 흐림성산19.7℃
  • 흐림서귀포22.4℃
  • 구름많음진주21.5℃
  • 흐림강화16.2℃
  • 구름많음양평20.6℃
  • 구름많음이천21.5℃
  • 맑음인제21.8℃
  • 구름조금홍천21.7℃
  • 구름조금태백23.4℃
  • 구름조금정선군24.3℃
  • 구름조금제천20.4℃
  • 구름조금보은20.2℃
  • 맑음천안21.1℃
  • 구름조금보령20.0℃
  • 구름조금부여20.5℃
  • 맑음금산21.8℃
  • 구름조금22.4℃
  • 맑음부안22.9℃
  • 구름조금임실23.0℃
  • 맑음정읍23.7℃
  • 구름조금남원23.5℃
  • 구름조금장수23.1℃
  • 구름조금고창군23.2℃
  • 구름많음영광군21.2℃
  • 구름많음김해시21.4℃
  • 구름조금순창군23.0℃
  • 구름많음북창원22.1℃
  • 구름많음양산시21.9℃
  • 구름많음보성군20.9℃
  • 구름많음강진군21.9℃
  • 구름많음장흥21.2℃
  • 구름많음해남21.5℃
  • 구름많음고흥21.5℃
  • 구름많음의령군22.5℃
  • 구름조금함양군23.4℃
  • 구름많음광양시21.9℃
  • 구름많음진도군22.2℃
  • 구름많음봉화19.7℃
  • 구름많음영주18.4℃
  • 구름조금문경18.9℃
  • 맑음청송군20.4℃
  • 맑음영덕21.3℃
  • 맑음의성20.4℃
  • 맑음구미21.4℃
  • 구름조금영천20.8℃
  • 구름조금경주시21.4℃
  • 구름많음거창22.5℃
  • 구름많음합천22.2℃
  • 구름많음밀양21.5℃
  • 구름많음산청22.7℃
  • 흐림거제19.6℃
  • 흐림남해19.6℃
  • 구름많음21.6℃
기상청 제공
인공지능 학습용 데이터, 역대 최대 규모 개방
  • 해당된 기사를 공유합니다

인공지능 학습용 데이터, 역대 최대 규모 개방

제조‧로보틱스 등 14대 분야 691종으로 데이터 다양화

[디지털금융신문]

 

과학기술정보통신부와 한국지능정보사회진흥원은 지난해 인공지능 학습용 데이터 구축사업을 통해 개발한 학습용 데이터셋 310종을 오늘부터 7월말까지 ‘AI허브’를 통해 순차 개방한다고 밝혔다.

 

올해 개방하는 데이터는 310종으로 역대 최대 규모다. 지난해 제조‧로보틱스‧교육‧금융‧스포츠 등의 14대 분야로 확장하면서 사업 규모를 크게 늘렸다. 이번에 310종 약 15억 건의 데이터 개방을 완료하면 ‘AI허브’ 이용자들은 총 691종, 약 26억 건의 데이터를 활용할 수 있게 된다. 특히 올해는 대규모 개방인 점을 고려하여, 이용자들이 더 많은 데이터를 조금이라도 빨리 활용할 수 있도록 품질검증 등을 먼저 마친 데이터를 우선 개방한다. 이에 따라 초기 개방 시점은 지난해보다 3개월 앞당겨진다. 매달 약 80여 종 내외를 개방해 7월말까지 전체 310종의 개방을 완료할 계획이다.

 
1차 개방에는 자연어 기반 질의‧검색‧생성 데이터, 고서(古書)한자‧한글 등 광학인식(OCR) 데이터, 안전환경 조성을 위한 실내외 군중 특성 데이터, 소방대원 행동 모션 3차원(3D) 객체 데이터 등 자연어와 인공지능 비전 분야에서 광범위하게 활용될 수 있는 약 70종의 데이터가 포함돼 있다. 
 
‘AI허브’에 공개되는 데이터는 국제 표준에 맞는 품질기준을 달성하고 개인정보 비식별화를 거친 경우에 한하며, 기업‧기관들이 실제 사용하는 인공지능 모델에 직접 데이터를 학습시켜 유효성, 정확성 등을 확인하는 활용성 검토를 받는다. 또한 개방 이후 약 3개월 동안은 사용자들로부터 데이터 품질 요구사항, 오류 등의 의견을 반영하여 데이터 품질 제고를 위한 보완 과정을 거칠 예정이다.

 

엄열 과기정통부 인공지능정책관은 “챗GPT 등 초거대 인공지능의 등장으로 인공지능 산업이 빠르게 발전하고 있다”며 “우리 기업들과 연구자들이 새로운 데이터 확보에 어려움을 겪지 않도록 기존의 라벨링 데이터(지도학습용) 중심 사업을 개편해 초거대 인공지능 학습에 필요한 대규모 비라벨링 데이터와 한번에 여러가지 유형을 학습시킬 수 있는 다중임무형 라벨링 데이터 등 다양한 유형의 데이터를 확보할  예정”이라고 밝혔다.

 

포토






모바일 버전으로 보기