반응형

과거 처음으로 딥러닝 관련 프로젝트가 상표와 디자인에서 유사 이미지 검색 시스템을 만드는 것이었다.

2019년 특허청에서 발주한 프로젝트였고, 당시 새로 시도하는 것이었기에 서로 안하려고 했던 프로젝트였다. 나는 TensorFlow와 keras를  처음으로 공부했는데, CNN 에 대해서는 과거 대학원 시절에 익숙한 연산들이었기에 이해하는데 어려움은 없었다.

당시 딥러닝 쪽 포럼등은 주로 딥러닝 망의 내부에서 무슨일이 벌어지고 있는지를 관찰을 한참 하던 시기였다. 즉, 당시 레이어에서 무슨일이 벌어지는지 이해하는 사람이 적었던 시절이다. 다만, 영상처리 공부를 해본 사람 입장에서는 CNN이 여러 콘볼루션 연산을 통해서 사실상 미분 등 픽셀에 대해 다양한 연산이 벌어지고 있고, 다양한 detector 알고리즘을 경험해봤다면, 내부에서는 필셀간 연산을 통해서 검출하려 한다는 것도 어느 정도 이해가 될 것이다.

이때 컴퓨터 비전을 처음 접한 사람들은 CNN이 블랙박스로 생각을 하겠지만, 사실 전통적으로 사람이 직접 설계하던 검출기를 딥러닝 방식으로 통해 자동으로 형성하게 설계하도록 구조를 변경한 것 뿐이다. 그러니 다층 더 깊은 층을 만들 수 록 더 다양한 연산을 해볼 수 있으니 품질이 높게 나오는 것은 당연한 것이다. 사람으로 치면 생각을 더 많이 해본다는 뜻이 되니까 말이다.

아무튼 vector DB가 등장한 사실은 2024년 초에 알게 되었다. 아마 2023년에 등장한 것으로 보이지만, 구성이라던거 설명한 것을 보면 2019년에 내가 직접 구현한 유사 이미지 검색 시스템과 거의 같다. 다만 설명부분에서 문제가 있는지 COS distance 에 대해서 각도로 이해하는 분들이 유튜브에 종종 보이더라. 임베디드 레이어에서 COS Distance의 의미는 다차원 벡터에서 동일 성분간 얼마나 유사한지를 판단하는 연산이 된다. 3차원으로 차원을 낮춰서 생각하면 이해가 쉬울 것이다.

근데, 이게 무리도 아닌게 당시 박사님들과 싸우면서 해당 시스템을 완성했는데, 설명을 해도 이해를 못 하셨었었다. 그래서 이 프로젝트가 여러모로 어려웠기 때문에 기억에 남는다. 그리고 이 프로젝트 이후 같이 참여 했던 교수님의 경우 이 때 기억에서 인상이 깊었는지 AI 회사에 실장으로 오라는 제의를 해주시기도 했는데, 지금은 그 때 갈껄 하고 후회하는 중이다.

해당 시스템은 국내에 특허로 내었는데, 당시 PM 맡으신 대표님이 내 이름은 빼놓아서 2개월전에 요청을 해서 추가하기로 합의를 보았다. 다시 이러한 딥러닝 분야를 연구하고 싶은데, 정작 비슷한 연구하는 곳에서는 해당분야 3년이 안되서 인지 면접도 못 가고 서류 탈락이 되고 있다. 그 동안 너무 다양한 분야를 한 것이 문제가 된 것 같다.

반응형

+ Recent posts