▲ 랭젠트와 그래프 시각화를 붙이며 정리한 데이터 우주 메모
데이터는 연결될 때 비로소 세계가 됐다
자료를 쌓아 두는 데는 익숙했지만, 그 자료들이 서로 어떤 거리를 두고 있는지는 사실 잘 못 보고 있었다. 엑셀, PDF, 코드, 메모, 로그, 공공데이터 같은 것들이 제각각 흩어져 있을 때는 분명 뭔가 많긴 한데, 그 많음이 바로 힘으로 전환되지는 않는다. 저도 한동안은 필요한 순간마다 검색해서 꺼내 쓰는 수준에 머물렀다. 그러다 파일들을 하나의 프레임워크 안에 넣고 시각화해 보니, ‘자료 보관’과 ‘지식 공간’은 전혀 다른 문제라는 게 확실히 보이기 시작했다.
특히 인상적이었던 건 데이터가 별처럼 흩어져 보이면서도, 동시에 군집과 관계가 한눈에 들어오기 시작했다는 점이다. 이건 보기 좋은 시각 효과를 넘어서 생각 구조를 바꾸는 경험에 가까웠다. 그전까지는 문서를 읽고 이해했다면, 그 이후부터는 데이터가 어떤 무리로 모이고 어떤 질문에 반응하는지를 공간감으로 느끼게 됐다.
“자료를 많이 갖고 있다는 사실보다, 그 자료들이 어떤 별자리로 묶이는지 볼 수 있다는 감각이 더 컸다.”
– 데이터를 그래프와 브라우저 시각화로 붙인 뒤 가장 크게 남은 인상이다.
벡터화만으로는 부족했고, 시각화가 붙자 비로소 감이 잡혔다
문서를 임베딩하고 검색하는 것만으로도 유용하지만, 그 상태만으로는 전체 구조가 잘 안 보인다. 반대로 그래프와 시각화를 붙이면 어떤 데이터가 중심에 있고 어떤 데이터가 가장자리로 밀려나 있는지가 직관적으로 보인다. 저는 그 차이가 꽤 컸다. 검색은 답을 찾는 행위였고, 시각화는 내가 어떤 세계를 갖고 있는지 이해하는 행위에 더 가까웠다.
검색어 하나가 별처럼 깜빡이는 순간부터 질문 방식이 달라졌다
예전에는 키워드를 입력하면 목록을 받는 정도였다. 지금은 특정 지역이나 개념을 넣었을 때 관련된 파티클이 어디에서 어떻게 반응하는지를 먼저 보게 된다. 그 시각적 반응 덕분에 질문도 달라졌다. 단순히 ‘무엇이 있나’보다 ‘무엇이 어디에 몰려 있나’, ‘이 군집과 저 군집은 왜 가까운가’ 쪽으로 이동한다. 이건 데이터 활용의 밀도를 분명히 바꾸는 경험이었다.
랭젠트 같은 프레임워크의 가치는 데이터 가공보다 사고 전환에 있었다
파이썬으로 가공하고, 크로마나 네오4j로 묶고, 브라우저로 뿌려 주는 기술 조합 자체도 흥미롭다. 하지만 저한테 더 크게 남은 건 기술의 화려함이 아니라 사고방식의 변화였다. 데이터는 더 이상 파일 모음이 아니고, 질문을 던지면 구조 자체가 반응하는 공간이 됐다. 이 차이 때문에 저는 요즘 데이터 프로젝트를 볼 때도 저장과 검색보다 ‘질문 가능한 우주를 만들고 있는가’를 먼저 보게 된다.
직접 만져 보고 남은 정리
- 가장 크게 느낀 점: 데이터가 힘을 가지는 순간은 많이 모였을 때보다 관계와 군집이 보이기 시작할 때였다.
- 실제로 달라진 부분: 키워드 검색이 목록 조회에서 공간적 패턴 읽기로 바뀌면서 질문 자체가 더 입체적으로 변했다.
- 한 줄 결론: 좋은 데이터 프레임워크는 파일을 저장하는 곳이 아니라, 질문하면 구조가 반응하는 우주를 만드는 쪽에 가깝다.
자료를 얼마나 많이 모았는지보다 그 자료를 어떤 세계로 바꾸었는지가 훨씬 중요하다는 걸 이번에 크게 느꼈다. 시각화는 단순한 장식이 아니었다. 내가 가진 데이터의 지형을 보게 만드는 인터페이스였다. 그래서 요즘은 데이터를 정리한다는 말을 들으면, 폴더 정리보다 먼저 세계 만들기 쪽을 떠올리게 된다.
Leave a Reply