.
블로그"nthought"에 대한 검색결과877건
  • [비공개] 모든 ML 알고리즘의 이해

    이직 후로는 면접에 들어가지 않고 있지만 면접에서 유능한 인재를 만나면 묻고 싶었지만 아직 한 번도 묻지 못한 질문이 있다. 머신러닝 학습의 핵심이 뭐냐? 는 질문이다. 개별 알고리즘의 개념이 아닌 모든 알고리즘들의 공통된 근간이 무엇인지를 묻는 질문이다. 내가 생각하는 이 질문의 답에 관한 글이다. 물론 내가 틀렸을 수도 있다.모든 — 적어도 내가 아는 모든 — ML 알고리즘은 유사도 (또는 거리)를 측정하는 거다. 나 (X)랑 닮은 X’를 찾거나 나랑 전혀 다른 X’’를 찾는 것이 ML 알고리즘이다. 회귀 Regression은 나랑 닮은 X들이 공통으로 같은 Y, 보통은 평균을 예측/계산하는 알고리즘이다. 분류 Classificaiton은 나와 근접한 X들이 다수를 점유하는 클래스를 찾는 거다. Clustering은 나랑 가까운 X들은 같은 그룹에, 먼 X들은 다른 그룹에 할당하는 거..
    nthought|2023-02-12 07:31 pm|추천

    추천

  • [비공개] 호모 애스쿠스: ChatGPT와의 조우

    인공지능 분야는 지루할 틈이 없다. 심심해질 만하면 또 새로운 장난감이 등장한다. 가장 최근에 주목을 끈 장난감은 분명 OpenAI에서 공개한 ChatGPT다. 기술을 잘 알지도 못하지만, 이 글에서 GPT (Generative Pretrained Transformer)가 사용하는 기술을 굳이 자세히 언급할 필요는 없을 것 같다. 다만 이전의 장난감들은 그저 소개한 기사나 동영상 또는 좀 더 기술적으로 궁금하면 관련 논문만 찾아 대강 훑어봤었는데, 소셜미디어에 관련 내용이 워낙 많이 소개돼서 이번에는 직접 가입해서 시연해봤다 정도의 차이가 있다. 부족함이 없진 않지만 최근 기술 발전이 그저 놀랍기만 하다. 소싯적의 심심이와는 차원이 다르다.간간히 틀린 정보도 눈에 띄고 학습 이후에 발생한 새로운 정보는 생성할 수 없기 때문에 당장 검색 엔진을 대체하는 데는 한계가 있어 보인다...
    nthought|2022-12-09 05:55 pm|추천

    추천

  • [비공개] 내가 일한 삼성과 카카오

    달고나 시리즈의 취지에 다소 어긋날 수도 있으나 국내에서 데이터 사이언티스트의 옵션이 별로 다양하지도 않고, 게 중에서 가장 큰 옵션은 삼성으로 대변되는 기존 대기업 그룹으로 진출하거나 카카오로 대변되는 인터넷 서비스 기업 (및 스타트업)에 취직하는 거다. 전문 연구소는 다소 이질적 집단이고 중소기업은 사실상 옵션으로 고려하라고 권하고 싶지 않다. 중소기업에서 기술을 배워서 대기업으로 레벨업하라는 조언도 간혹 듣겠지만 이걸 자세히 얘기하려면 애초에 대학 교육부터 시작해야 하는 큰 주제여서 이글에선 생략한다. 다음/카카오는 13년을 넘게 다녔고 이제 겨우 삼성리서치에서 1년을 보낸 사람으로서 모든 걸 안다고 말할 수는 없으나 그냥 개인의 경험과 관점에서 정리한 거니 자신의 경험과 맞지 않다면 ‘넌 그렇게 경험/생..
    nthought|2022-10-23 04:36 pm|추천

    추천

  • [비공개] 특허 이야기

    삼성리서치의 팀 전체와 팀장의 KPI에는 상위 저널/학회에 제출된 논문 편수와 특허 발명 건수가 포함된다. 개인 KPI에는 명시적으로 포함되지 않더라도 어차피 최종 평가자인 팀장의 KPI 달성(에의 기여) 여부가 팀장이 개인을 평가하는데 일부 반영되기 때문에 논문 작성과 발명을 게을리할 수는 없다. 8월 말과 9월 초에는 논문을 채우려 애썼는데, 지금은 부족한 특허를 채우기 위해서 고민 중이다. 예전에는 소프트웨어나 알고리즘에 관한 독창성이 특허로 이어지느냐에 관한 논란이 있었지만, 요즘은 당연히 특허로 인정받을 뿐 아니라 AI 기술을 접목한 특허가 꽤 많이 늘고 있다. 당장의 목표는 데이터 사이언티스트가 되기 또는 데이터 사이언티스트로 취업 (창업)하기일 수도 있으나 중장기적으로 내가 고안한 아이디어가 지적재산이 될 수 있는가?..
    nthought|2022-10-03 03:48 pm|추천

    추천

  • [비공개] 알고리즘 소개: Product Quantization

    오랜만에 알고리즘을 소개하는 글을 적는다. 몇 달 전에 처음 Product Quantization (PQ)를 접하고 재미있어서 — 간단하지만 효과 있어서 — 간단한 소개글을 적으려 했으나, 페이스북에서 이 알고리즘을 제안한 논문 (Optimized Product Quantization for Approximate Nearest Neoghbor Search)을 제출한지도 벌써 10년이 더 지났고 FAISS: a library for efficient similarity search라는 오픈소스도 공개돼있어서 굳이 이제야 글을 적어야 할까?를 오래 고민했지만, 최근에 너무 가벼운 글들만 적었고 또 이 글을 통해서 PQ라는 알고리즘을 처음 접할 이들도 있을 것 같아 글을 적기로 했다. 알고리즘 자체는 매우 간단해서 여러 블로그 포스팅을 참조해서 원 논문을 읽어보면 쉽게 이해할 수 있다. 대신 처음 PQ를 접하고 떠올랐던 생각을 위주로 글을 적는다. 나도 논문을 몇 편 적어봤지만 공돌이..
    nthought|2022-09-25 01:34 pm|추천

    추천

  • [비공개] 인피니트 게임

    데이터나 알고리즘에 관한 글은 아니다. 그저 책 소개라기보단 그 속의 개념을 내 방식으로 좀 풀어보려 한다. 넓게는 사람이 살아가는 모든 것이 데이터와 알고리즘이니 정말 무관한 주제도 아니다. 어쩌면 특정 알고리즘이나 기법을 소개하는 것보단 이런 개념을 공유하는 게 더 나은 데이터 사이언티스트, 개발자/기획자/경영자 또는 그냥 인간이 되는데 도움이 되리라 믿는다.저자 사이먼 시넥 Simon Sinek은 꽤 유명하다. 거의 10년 전에 그의 TEDx 영상이 공개됐을 때 많은 사람들이 열광했고 소셜 미디어에 계속 퍼 날라졌다. ‘How great leaders inspire action’이란 제목의 TEDxPugetSound 영상은 이미 6천만 번 조회됐고 1.7백만의 좋아요를 받았다 (TED 공홈 기준). 몸에 좋은 음식을 한 번 먹는다고 당장 사람이 건강해지지 않듯이 좋은 생각이 전파되더라도 사람이..
    nthought|2022-09-18 07:07 pm|추천

    추천

  • [비공개] 영작 Writing in English

    I'm back.학교를 나온 후로 거의 15년 만에 논문이란 걸 적었다. 주저자는 아니지만 오랜만에 빨간펜 질을 하니 묘한 희열을 느낀다. 엉터리 영작을 교수님께 보내면 전체가 시뻘겋게 돼서 돌아온 기억이 새록새록한데, 이번에는 그 반대였다. 그냥 아이디어를 생각해서 구현, 실험해보고 논문을 작성하는 게 한편으론 내게 더 맞는 분야인 것 같다. 학계에는 남지 않겠다는 생각과 인터넷 비즈니스에 깊이 관여해야겠다는 생각이 지난 15년의 시간이었는데, 약간은 과거를 부정하는 모양새다. 난 거의 모든 종류의 언어에 약하다. 수학이 좋아서 이과를 선택한 것이 아니라 국어를 못 해서 이과로 간 거다. 영어는 여전히 난제다. 이직 후로 몇 차례 해외연과 화상회의에 참석하지만 난 늘 회의실 모퉁이에 그저 놓인 망부석일 뿐이다. 도저히 못 알아듣겠고 ..
    nthought|2022-09-04 09:21 am|추천

    추천

  • [비공개] 정의가 곧 정의다.

    문과와 이과를 가르는 명확한 판단 기준이 있다. ‘정의’에 해당하는 영단어가 무엇인지에 따라서 갈린다. Justice라 답하면 문과고 Definition이라 답하면 이과다. 그냥 우스갯소리로 치부했는데 몇 주 전에 정의를 잘 내리는 것이 곧 정의로운 것이라는 생각이 스치듯 떠올랐다. 이 글을 적는 취지는 데이터 과학을 포함하지만 데이터 과학만으로 제한하지도 않는다.달고나 시리즈에서도 언급했는지 아니면 그냥 페이스북 담벼락에만 남겼는지 모르겠지만 개인적으로 한중일의 저자의 책은 잘 읽지 않는 편이다. 여러 번의 경험을 통해 얻은 편견이지만 그럼에도 여러 추천 글을 보면 또 속는 셈 치고 사서 읽어보기도 한다. 대부분은 내 편견을 강화시켜주지만 가끔 괜찮은 책을 만나기도 한다. 책 전체가 마음에 드는 건 아니더라도 전체적인 주제 의식이..
    nthought|2022-07-31 04:03 pm|추천

    추천

  • [비공개] 광고 매출 공식

    제목이 영 맘에 들지 않는다. 보통 제목을 정하고 일을 시작하는 편이다. 글의 제목을 먼저 정하고 상세한 내용을 적는다거나 프로젝트명이나 코드명이 맘에 들면 그 프로젝트나 프로그래밍이 그냥 잘 진행되는 것 같다. 때론 이름을 정했어도 빛을 보지 못하고 묻힌 경우도 많다. 어쨌든 좋은 이름을 가지면 기분이 좋다. 그래서 이번 글의 전개가 심히 걱정된다. 기업이나 개인이 광고를 집행함으로써 매출을 극대화하는 것에 관한 글이 아니다. 온라인 광고 플랫폼을 갖은 기업이 광고를 통해서 매출을 올리는 일반적인 방법 또는 전략을 수식의 형태로 정리한 거다. 수식이라 해서 뭔가 복잡한 건 아니다. 일부 용어의 생소함은 있겠지만 곱셈으로만 이뤄졌다. (부분적으로 나눗셈이 포함됐다고 반박할 수도 있으나 나눗셈도 곱셈의 변형이니 그냥 곱..
    nthought|2022-07-10 05:09 pm|추천

    추천

  • [비공개] 랭킹에 관하여 Run-to-King

    우리 일상의 많은 것이 랭킹과 관련 있다. 어쩌면 삶의 모든 것이 랭킹이다. 왕좌를 향해 달려가듯이 피라미드의 가장 높은 곳으로 올라가는 경쟁이 한편으론 우리를 각성케 한다. 속되게 말해서 줄세우기와 줄타기가 결국 랭킹이다. 비교나 연결도 랭킹으로 해결할 수 있다. 얼마나 가까운가 또는 먼가를 측정하고 붙일 것인가 뗄 것인가를 고민하는 것이 랭킹인 거다. 특히 데이터 분석이나 인공지능에선 업무의 대부분이 랭킹이고, 더 좋은 랭킹 알고리즘을 찾으면 레벨업하는 거다. 운 좋게도 Daum의 검색 본부로 입사해서 검색 랭킹의 극히 일부를 담당하기도 했었고 이후 추천 서비스들을 만들 때도 많은 아이템들을 줄 세운 후에 Top N개를 골라내는 일을 했고, 광고 분야로 옮긴 후는 Top 1을 선택하는데 기여했다. 신규 채용을 위한 여러 인터뷰에 들..
    nthought|2022-07-02 06:02 pm|추천

    추천

이전  1 2 3 4 5 6 7 ... 88  다음
셀로거는 비즈니스/마케팅 관련 블로그중 대중에게 RSS를 제공하는 블로그의 정보만 수집 및 정리하여 소개하는 비상업적 메타블로그 사이트입니다.
수집된 내용에 대한 모든 블로그의 저작권은 모두 해당 블로거에게 있으며 공개되는 내용에 대해서는 Sellogger의 입장과 무관합니다.
셀로거에서는 원글의 재편집 및 수정을 하지 않으며 원문링크를 제공하여 전문확인을 위해서는 저작권자의 블로그에서만 확인가능합니다.
Copyright (c) Sellogger. All rights reserved. 피드등록/삭제요청 help@sellogger.com