최형광 칼럼 | 데이터는 더 이상 정제되지 않는다

데이터는 원목, 원유와 같다. 처리되는 과정을 거쳐야 비로소 가치를 갖게 되는 자원이다. 데이터가 쌓인다고 정보가 되거나 지식으로 발전되지 않는다. (관련 칼럼: 데이터 비긴즈.) 프로그래머는 데이터를 정제하고 엑셀과 SQL로 다듬는다. 결측치를 제거하고, 이상치를 조정하며 데이터를 ‘쓸만한 정보’로 만들기 위해 노력한다. 생성형 AI의 시대의 대규모 언어모델(LLM)은 정제 과정 없이 데이터를 해석하고 의미를 도출한다. 데이터 처리와 지식 체계화…