인공지능 학습데이터 확보를 위한 제도 개선 사항

0
344

인공지능 학습데이터 확보를 위한 제도 개선 사항

◦ 인공지능의 활용을 위해서는 학습을 위한 데이터가 필요하며 인공지능 서비스의 품질과 성능은 양질의 데이터를 보다 많이 활용할수록 높아지므로 다양한 원천에서 데이터를 수집할 필요가 있으나,
- 학습용 데이터를 수집·이용하는 과정에서 저작권 등의 침해 이슈가 발생할 수 있음
*예를 들어, 데이터가 수집되어 저장되고 공유 또는 분석을 위하여 전달되는 과정에서 복제권, 공중송신권 침해 등이 문제가 될 수 있음
- 또한 학습용 데이터셋을 만드는 과정에서 성명표시권, 동일성유지권 침해와 같은 저작인격권 문제도 발생할 수 있음

◦ 「저작권법」 제35조의3에 근거하여 학습용 데이터 구축시에는 저작권법의 제재를 피해갈 수 있는 여지가 있으나,
- 규제 불확실성을 제거하고 인공지능의 연구·개발을 촉진하기 위해서는 저작권법을 개정하여 저작물을 인공지능 학습용 데이터베이스의 작성에 활용할 수 있게 하고, 작성된 데이터베이스를 제한된 범위 내에서 제공 또는 공유할 수 있도록 법에 명시
*일본 저작권법 제47조의7과 유사한 내용을 저작권법에 명시하는 방안을 고려할 수 있음

◦ 학습용 데이터의 구축과 공개·공유는 특히 데이터의 확보에 어려움을 겪는 신생 스타트업들이 새로운 알고리즘을 개발하거나 자신이 개발한 알고리즘을 검증하는 데에 유용하게 사용될 수 있으며,
- 또한 ImageNet과 같은 전 세계를 대상으로 하는 학습용 데이터가 아닌, 한국에 특화된 학습용 데이터 구축에 기여하여 한국의 언어나 생활에 가까운 맞춤형 서비스를 제공하는 데에도 기여

◦ 인공지능 학습용 데이터 구축을 위해 저작권법 예외 조항 혹은 공정 이용으로 둘 경우 저작권자의 권리 침해에 대한 반발이 예상
- 향후 혁신 기술 수용을 위해 인공지능 학습용 데이터 구축에 대한 현행 법적 근거를 분명히 할 필요가 있으나 제3자(저작권자)의 권리를 침해하는 경우는 허용할 수 없기 때문에 순차적으로 법 개정을 추진하는 방안을 제안함
- 법을 개정한다고 하더라도 인공지능을 학습시킨 후 알고리즘이 완성되면 사용한 저작물을 즉각 삭제하거나 제3자 송신 및 제공을 못하도록 규제하여 저작권자의 권한이 지속적으로 침해되는 문제를 최소화 하는 방안을 고려할 필요가 있음
- 또한 구축한 데이터셋을 공개하거나 제3자와 거래하는 경우에는 예외조항 적용에서 제외하는 방안을 고려하는 등 보수적 개정 방향을 검토하는 것도 필요함