거대한 파도가 되어 덮친 제3의 물결 <모두 거짓말을 한다>
모두 거짓말을 한다 - Seth Stephens-Davidowitz
'정보화의 잔잔한 물결이 거대한 파도가 됐고, 현재 데이터 홍수 속을 헤엄치며 살아가고 있다.'
나는 불과 10여 년 전만 해도 카카오톡이 등장해 문자를 대체할 거라고 상상도 못 했다. 핸드폰으로 네이버를 자유롭게 쓸 수 있을 거라는 생각도 못했다. 당시 화장실에서 네이버 웹툰을 본다 하면 어떤 멍청이가 노트북을 들고 화장실에 갔다고 했을 것이다. 하지만 세상이 달라졌다. 이제는 차량이 스스로 운전을 하고, 완벽하게 운전을 할 수 있냐에 배팅을 하는 시대가 왔다.
'우리는 급변하는 21세기에 살고 있다.'
4차 산업 혁명, 인공지능, 알고리즘, IoT, ICT, 블록체인, 그리고 빅데이터 등등 몇 년 전부터 뜨겁게 달아오르는 용어들이다. 어느 미디어를 둘러봐도 접할 수 있는 흔한 것이 되었다. 이미 많은 기업들이 아직 완성이라고 하기에는 부족하지만 준비단계를 지나 기술을 실용화, 제품화하는 단계에 이르렀다. 늦은 감이 있지만 이러한 급격한 변화의 흐름 속에서 질질 끌려가는 게 아닌, 같이 흘러가고 싶은 마음에 빅데이터에 관한 책 한 권을 집어 들었다.
세스 스티븐스 다비도위츠의 모두 거짓말을 한다는 여러 유형의 빅데이터 중에서도 우리가 쉽게 접하고 이용할 수 있는 구글의 검색에 큰 비중을 두고 있다.
구글의 데이터 과학자였던 그는 빅데이터를 이용한 연구로 구글에 입사한 후 빅데이터의 힘을 다방면으로 사용했다. 구글뿐 아니라 위키피디아, 스톰프런트, 심지어 미국 대형 포르노 사이트의 데이터까지 긁어모아 여러 시도들을 하고 결과를 만들어냈다.
그리고 빅데이터로 무엇을 할 수 있는지 증거를 제공하기 위해 이 책을 집필했다. "데이터 과학자로서 세상을 이해하기"라는 장대한 목표를 달성하는 과정의 일부를 담아놓은 책 이기도 하다. 또 저자는 “사회과학이 진정한 과학이 되고 있다.”라며 밝은 미래를 말해준다. 세상을 이해하는 강력한 도구인 빅데이터의 설명서를 펼쳐보자.
º
우리는 21세기 정보화 시대의 잔잔한 물결이 거대한 파도가 되는 걸 보았고, 현재 데이터 홍수 속을 헤엄치며 살아가고 있다. 거대한 인류가 인터넷을 사용하며 남긴 복잡한 흔적이 알게 모르게 쌓여가며 빅데이터를 이뤘다. 이 데이터는 단순 검색을 떠나 사진, 단어, 행동 등 모든 데이터를 말한다. 이제 이 거대한 데이터 더미로부터 단물을 뽑아먹을 차례다.
먼저 알고 넘어가야 할게 있다, 데이터가 크다고 무조건 좋은 건 아니다. 이 거대한 데이터 뭉치를 깎고 다듬어 유의미하게 만드는 사람만이 진정한 빅데이터의 이점을 취할 수 있다. 이러한 빅데이터의 활용도가 무궁무진한 만큼 누가 어떻게 사용하느냐에 따라 결과도 천차만별이다.
정보의 양과 질이 폭발적으로 증가해서 만들어진 빅데이터인 만큼 깎아내야 할 부분도 많다. 홍수 속 쓸려 들어온 쓸모없는, 때론 위협적인 데이터들도 존재하기 때문이다. 아무리 중요한 정보를 담은 데이터라도 인간의 판단을 필요로 한다.
개방적이고 유연한 사고를 갖은 사람들이 홍수 속에서 유의미한 데이터를 찾아낸다. 그들은 필요에 따라 하나의 데이터도 관점을 달리해 다각도로 본다. 그리고 때론 빅데이터와 상호 보완적인 소규모 설문조사를 사용해 판단하기도 한다.
'빅데이터에는 사각지대가 존재하기 때문이다.'
구글이 검색 분야의 지배적인 위치에 오른 이유는 단순히 많은 양의 데이터를 제공해서가 아니다. 구글은 더 나은 질의 데이터를 제공하기 때문이다. 이처럼 영리한 데이터 기업들은 종종 데이터를 줄인다. 홍수 속 정보 소비자에게 ‘필요하고 유의미한’ 데이터를 주기 위함이다. 그렇게 찾아낸 유의미한 데이터들은 생명력을 부여받고 힘을 갖게 된다.
정보화 시대로의 혁명을 통해 인터넷으로 전 세계를 연결할 수 있게 됐다. 빅데이터가 큰 힘을 갖고 의미를 갖는 이유는 여기에 있다. 인류는 정보화에 발맞춰 인터넷을 사용하고 흔적들을 남긴다. 그 흔적들은 누군가에게는 불필요한 정보이지만 몇몇 개방적이고 유연한 사고를 갖은 사람들에게는 노다지 광산이나 다름없다.
'데이터의 힘을 이용해 갖게 되는 가장 큰 장점은 문제에서 해답으로 이끌어 주는 능력이다.'
빅데이터의 혜택은 소수만을 위한 특권이 아니다, 누구나 빅데이터를 이해하고 이용해 문제의 해답을 이끌어 낼 수 있다. 이제는 세상의 문제에 관한 풍부한 데이터가 존재하기 때문이다. 기억해야 할 점은 빅데이터를 이용할 줄 아는 사람만이 그저 데이터 덩어리 이상의 것을 취하는 것이다.
º
4차 산업혁명으로 인해 많은 것들이 바뀌고 있다. 그중 빅데이터를 다룬 세스 스티븐스 다비도위츠의 「모두 거짓말을 한다」를 읽으며 '빅데이터로 이런 게 가능하구나'하며 신기했다. 하지만 생각해보니 마냥 신기해 할 수만은 없었다. 누구나 빅데이터에 접근할 수 있지만, 정보화된 삶을 살고 있는 이들만 해당되는 말은 아닐까?
큰 플랫폼은 데이터를 독식하고, 인건비가 싼 지역에 있던 공장들은 자국으로 돌아간다. 이제 선진국으로부터 배움의 기회마저 사라져 가는 삭막한 현실.
정보 독식이 가속화되고 리쇼어링이 벌어지는 세상은 또 다른 대분기를 맞이해 더 이상 80/20이 아닌 99/1에 가까워지는 게 아닌가 하는 걱정이 들기도 했다.
이렇게 소수의 눈뜬 사람들과 기업들이 집중하는, 무엇이 나올지 모르는 이 거대한 미지의 광산, 빅데이터의 구체적 이용 방법들을 살펴보자.
Google, Facebook, Netflix, 그리고 빅데이터
모두 거짓말을 한다 - Seth Stephens-Davidowitz. '언제까지 구글에 이용만 당할 것인가?' 앞서 우리가 사는 세상과 빅데이터가 만들어진 배경에 대해서 짚어보았다. 이제 빅데이터가 힘을 가지는 이유에 대해 더..
storyofbo.tistory.com
21세기 구글 넷플릭스 페이스북 정보화 구글 검색 모두 거짓말을 한다 빅데이터 빅데이터 사용법 빅데이터 이용 4차 산업혁명 세스 스티븐스 다비도위츠 21세기 구글 넷플릭스 페이스북 정보화 구글 검색 모두 거짓말을 한다 빅데이터 빅데이터 사용법 빅데이터 이용 4차 산업혁명 세스 스티븐스 다비도위츠 21세기 구글 넷플릭스 페이스북 정보화 구글 검색 모두 거짓말을 한다 빅데이터 빅데이터 사용법 빅데이터 이용 4차 산업혁명 세스 스티븐스 다비도위츠
4차 산업혁명, 구글, 글로벌, 모두 거짓말을 한다, 빅데이터, 빅데이터 사용법, 빅데이터 이용, 산업혁명, 세스 스티븐스 다비도위츠, 정보화, 빅데이터, 구글검색 제3의 물결