.
블로그"nthought"에 대한 검색결과879건
  • [비공개] 라떼의 텍스트 마이닝 Text Mining for Dummy

    텍스트 마이닝이란 표현도 이젠 좀 올드해 보인다. NLP는 이미수십 년전부터 있던 건데 여전히 유효하고 딥러닝 이후 더 중요해졌다. 랭귀지 모델이란 용어는 언제부터 사용된 걸까? 어쨌든 요즘 자연어 연구의 방법은 다소 획일화된 듯하다. 일단 단어를Word2Vec이나GloVe 등으로워드 임베딩을하고, 이를 문장 (등의) 단위로 연결해서 RNN 또는 이후 등장한 여러 딥러닝 기반 모델에 넣으면 그냥 끝난다. 자연어처리와는다소 무관한 경력을쌓긴 했지만그래도 키워드와 텍스트는 늘 조금씩 다뤄왔기에 전통적인 텍스트 마이닝 기법들을 정리, 소개하려 한다. 최근에 입문한 분들은 요즘 방식이 더 친숙하겠지만, 과거의 방식에서 여전히 유효한 것들이 많으니 참고 삼아 읽으면 보면 좋을 거다. 텍스트 마이닝이라고 했지만, 오랫동안 검색 서비스 관련 업무에 ..
    nthought|2021-07-20 11:16 am|추천

    추천

  • [비공개] 미래의 데이터 과학자

    인턴 파투 이후로 준비했던 과제를 직접 구현해서 실험해야 했다. 전에도 적었지만 데이터 과학자로서 나의 결정적인 단점은 프로그래밍에 능하지도 않고 즐기지도 않는다는 거다.잘하지못하니 즐기지 않는 것인지 아니면 즐기지 않으니잘하지못하는것인지는구분하기 어려우나 현재는잘하지도못하고 즐기지도 못한다. 평소에는 여러 문제 상황에서 머리로만 검토해서 해결 방법을 제시하거나 필요한 데이터만 간단히 SQL과 엑셀 잡으로 분석하고, 더 정교한 실험이나 프로덕션은 더 잘하는 담당자에게 넘겨주면 된다. 그럼에도 1년에한두 번꼴로 직접 더 복잡한 프로그램을코딩해야 할때가 가끔 있다. 모두 바빠서 손이 없을 때도 있고 이전 업무와는 결이 다른 POC 작업일 때도 있고 아주 가끔은 아직 서비스와는 조금 먼 최신 기술을 직접확인해봐야 ..
    nthought|2021-07-12 10:37 am|추천

    추천

  • [비공개] 데이터 과학자의 글쓰기

    글쓰기 테크닉에 관한 글이 아니다. 내가 글을 수려하게 잘 적는다는 의미도 아니다. 그냥 데이터 과학자를 포함한 모든 지식 노동자는, 아니 누구나 평소에 글 적는 걸 즐기고 연습해야 한다는 취지다. 생각은 글로 표현되고 글에서 행동이 나온다. 여름 인턴 멘토링을 준비하면서 멘티들에게 책을 추천, 선물하는 과정이 있었다. 정리 문서에 '개발자의 글쓰기'란 책이 중복 추천되는 걸 봤다. 팀의 다른 멘토가 이 책을 언급했지만 다른 개발자들도 글쓰기의 필요성과 중요성에 공감하고 있는 듯하다. 물론 해당 책은 개발자들이 주로 다루는 네이밍 방식, 소스 코드나 커밋 로그에 주석이나 릴리즈 노트 적는 법, 위키나 지라 작성 법, 제안서 적기 등 Technical Writing을 다루기는 하지만, 적어도 개발자에게 글쓰기가 중요하다는 점은 시사하고 있다. 재택..
    nthought|2021-07-05 06:19 pm|추천

    추천

  • [비공개] 데이터 과학자의 생각법

    원래는 지난 면접들을 통해서 '얘네들이 아직은 데이터 문제를 해결하는 프로세스 또는 프랙티스가 약하구나'라는 발견에 기반해서 '데이터 문제 해결하기'라는 글을 적으려 했었다. 그런데 이미 달고나 초기에 '데이터 문제 해결 프로세스' (https://brunch.co.kr/@jejugrapher/219)라는 글을 적었다는 깨달았다. 그럼에도 생각은 늘 상황에 따라서 바뀌는 거라서 지난 인터뷰에서 느낀 감정과 생각으로-- 1~2주를 쉰 후에 -- 같지만 다른 글을 적어야겠다고 마음먹었는데, 지난밤에 우연히 봤던 글을 함께 공유하면 좋을 것 같아서 짧게 적는다. 인터뷰에서 느꼈던 감정은 큰 부분이 결국 생각하는 방법에 관한 거였다. 요즘 데이터 과학이나 ML 개발자를 하겠다는 친구들의 스킬은 분명 내가 그네들의 나이 때 가졌던 것보다 월등하다는 걸 알고 있다. 그럼에도 아직은..
    nthought|2021-06-14 08:54 am|추천

    추천

  • [비공개] 좋은 데이터 과학자란?

    인턴십 인터뷰가 거의 끝나갈 무렵 현타가 왔다. 지원자에 대한 나의 평가는 온당한가?라는 의문이 문득 들었다. 아무리 객관적이려고 해도 평가라는 게 완전한 객관성을 담보할 수 없다. 나는 괜찮게 봤는데 다른 면접관들은 별로라고 한다. 그 반대의 경우도 흔하다. 모두가 좋다고 하거나 모두가 아니다고 하는 경우는 마음이 편한데, 의견이 엇갈리면 심적으로 미묘한 갈등이 생긴다. 내 돈으로 월급을 준다거나 직급이라도 있어서 내가 책임질 수 있으면 내 주장을 더 강하게 내세우겠지만, 그렇지 않기 때문에 의견을 포기하는 경우가 흔하다. 나를 아는 또는 같이 면접에 들어간 이들이 이걸 보면 동의하지 않을지도 모르겠으나 누군가 이 지원자를 합격시켜야 한다고 했을 때 탈락 의견을 내지도 않았고, 탈락시키려는 걸 굳이 합격으로 고집하지..
    nthought|2021-06-07 10:26 am|추천

    추천

  • [비공개] (인터뷰에서) 갑이 되어라

    여름 인턴십 면접이 이어지고 있다. 다양한 지원자들을 보면서 면접관들로부터 어떤 평가를 받는 것이 지원자에게 가장 치명적일까?를 생각해봤다. 최근 인터뷰 탈락 이유를 알려줘야 한다는 취지의 법제화도 논의되고 있는데, 만약 이런 법이 이뤄지고 탈락자가 자신의 탈락 이유를 받아봤을 때 어떤 평가가 가장 치명적일까? 바로 지난 글에서도 적었지만 기술적인 부족함보다 태도나 인성적인 평가가 더 치명적일 거라 생각한다. 실력이 부족하다거나 기대치에 못 미친다는 평가는 냉정하게 생각하면 탈락자도 수긍할 수 있다. 면접관들이 대체로 정확하고 면접에서 특별한 실수가 없는데도 '실력 부족'이라고 하면 객관적으로 실력이 부족하거나 면접관들이 지원자에게 갖은 기대치가 더 높았다는 걸 의미한다. 면접관들이 실수했을 수도 있지만 다..
    nthought|2021-06-04 08:24 am|추천

    추천

  • [비공개] 태도가 실력이다 (인터뷰)

    독자들에게는 다소 미안하지만 '달고나' 카테고리에 최근에는 인터뷰 관련해서 글을 더 자주 올리고 있다. 특정 데이터 분석 또는 머신러닝 기술/알고리즘에 대한 소개나 설명은 이미 다른 레퍼런스가 많기에 굳이 내가 더 자세히 적을 필요가 적다. 때론 나만의 다른 관점으로 알고리즘을 해석하는 경우도 있겠지만, 기술적인 내용을 원한다면 다른 자료를 참고하기 바란다. 이 분야에서 커리어를 시작하는 이들에게 특정 기술을 하나 더 소개해주는 것보단 관련 업계에 어떻게 진입할 수 있는지에 관한 조금의 힌트를 주는 게 더 나을 수도 있다는 판단에서다. 어떤 기술은 궁할 때 찾아보면 된다. 늘 이직이 잦은 업계에서일하다 보니최근 인터뷰에 자주 들어가게 되고, 특히 이번 주는 하계 인턴 채용을 위한 면접이 꽉 차있다. 오늘도다섯 개의인터뷰..
    nthought|2021-05-31 07:58 pm|추천

    추천

  • [비공개] 면접 과제 II

    (adsbygoogle = window.adsbygoogle || []).push({}); 이전 글에서 원활한 진행과 바른 평가를 위해서 인터뷰 과제를 제시하곤 한다고 했다. 다양한 종류의 과제가 가능하겠지만, 본인이 참여한 인터뷰에서는 다음의 3가지 유형의 과제가 많았다. 예시 데이터와 함께 문제 상황을 설명하고 이를 어떻게 해결할지를 묻는 유형 제공된 데이터를 분석하거나 제시된 알고리즘을 구현하는 유형, 그리고 현업에 적용한 논문을 읽고 리뷰하는 유형 논문 리뷰 유형은 이전 글에서 자세히 적었고, 이번 글은 앞 두 유형에서 공통적인 걸 설명한다. 간혹 특정 기계학습 알고리즘을 특정 언어로 구현하라는 과제가 있을 수도 있으나, 문제 해결 방법을 요구하는 과제들은 '이것만이 정답이다'라는 그런 것이 없다. 다만 문제를 얼마나 포괄적으로 이해해서 다양한 시각으로 접근했..
    nthought|2021-04-14 09:26 am|추천

    추천

  • [비공개] 인터뷰: 논문 과제

    (adsbygoogle = window.adsbygoogle || []).push({}); 이력서에 적힌 경력 사항과 자기소개 글만으로 지원자를 평가하거나 면접을 진행하기에는 부족한 점이 많다. 특히 석박사 학위조차도 없는 경력이 전무한 지원자나 회사 경력이 1~2년으로 짧아 수행한 프로젝트 실적이 별로 없는 경우는 제대로 판단할 수 없을뿐더러 때론 적당한 질문 거리를 찾지 못해서 면접이 매끄럽지 못한 경우가 종종 있다. 경력이 전무한 경우 인턴/수습이라는 안전장치를 마련하기도 하지만 면접보다는 조금 나을 뿐 2~3개월 동안 수행한 인턴 과제만으로 온전히 평가하기는 여전히 힘들거니와 -- 다소 부족한 경우 -- 한 번 같이 일한 친구를 과감히 탈락시키는 것도 때론 힘들다. 업무와 거리가 먼 신변잡기를 묻는 것도 공식 인터뷰에서 적절치 않다. 물론 내 기준으로 합격선을 통과한 경..
    nthought|2021-03-22 10:10 am|추천

    추천

  • [비공개] 데이터 과학자의 취준 (자기소개와 면접)

    (adsbygoogle = window.adsbygoogle || []).push({}); ** 주의: 현재 속해있는 조직 (회사, 팀)의 공식 정책/방향/입장이 아니다. 순전히 개인 의견이다. 데이터 과학자 채용을 위한 개별 인터뷰 질문 별로 언젠가는 글을 적기는 해야겠지만, 오늘은 지난 몇 년 동안 인재 영입 과정으로 서류를 검토하고 면접에 참여하면서 공통적으로 느낀 아쉬움에 관해서 적는다. 데이터 과학자뿐만 아니라 다른 개발 직군도 글에서 밝힌 것과 크게 다르지 않으리라 본다. 기획, 영업, 마케팅 쪽은 다소 다를 수도 있지만, 기본 원칙은 크게 차이가 없을 테니 독이 되지는 않을 거다. 제한된 경험이지만 백 명 넘는 지원자의 이력서를 검토했고 그중 수십 명은 직접 면접관으로 참여했다. 새로운 사람을 맞이하는 건 늘 설레기에 영입 시스템에 새로운 이력서가 등록되거나 면접 참석 요청..
    nthought|2021-03-08 11:00 am|추천

    추천

이전  2 3 4 5 6 7 8 9 10 ... 88  다음
셀로거는 비즈니스/마케팅 관련 블로그중 대중에게 RSS를 제공하는 블로그의 정보만 수집 및 정리하여 소개하는 비상업적 메타블로그 사이트입니다.
수집된 내용에 대한 모든 블로그의 저작권은 모두 해당 블로거에게 있으며 공개되는 내용에 대해서는 Sellogger의 입장과 무관합니다.
셀로거에서는 원글의 재편집 및 수정을 하지 않으며 원문링크를 제공하여 전문확인을 위해서는 저작권자의 블로그에서만 확인가능합니다.
Copyright (c) Sellogger. All rights reserved. 피드등록/삭제요청 help@sellogger.com