본 글은 다음과 같은 순서로 전개됩니다.!
1. 논문 검색의 목적을 명확하게 한다.
2. 논문 검색 목적에 따른 논문 검색 방법
2.1. 막연한 상태에서 특정 분야를 공부하고자 하는 상태
2.1.1 특정 분야에 대한 공부를 계속하기 위한 논문 검색
2.2 연구를 시작하는 과정에서 내가 보고자 하는 주제와 연관되는, 참고할 법 한 레퍼런스 논문 검색
2.3 새로운 연구과제 제안을 위한 선행연구 검색하기
2.4 방법론을 구체적으로 찾기 위한 논문 검색
3. 원하는 결과물을 얻기 위한 각종 검색 팁
3.1 구글의 이미지 검색을 활용하기
3.2 영문으로 된 문서가 아직 익숙하지 않아 국문으로 된 레퍼런스를 찾는 경우
3.3 검색하기에 좋은 키워드를 설정하기
1. 논문 검색의 목적을 명확하게 한다.
논문을 찾고자 할 때 여러가지 목적이 있을 것 같습니다. 가장 흔하게는 막연한 상태에서 공부해야지! 하고 달려드는 상태일 테고, 작성하고 있는 논문의 레퍼런스를 찾기 위함일 수도 있고, 수행하고자 하는 실험이나, 참고하고자 하는 figure가 존재할 때 '어떻게' 를 얻기 위한 검색 일 수도 있겠지요. 분석 과정에서 지금 살펴보고 있는 대상이 선행 연구에서 어떤 결과를 만들었는지 같은 경우에도 논문 검색을 하게 될 것 같습니다.! 당연하게도 무엇을 위한 검색인지를 명확히 하고 그에 따라 다른 검색 전략을 활용하면 보다 효율적으로 논문을 찾을 수 있습니다. 아래에 제시하는 경우가 아니더라도, 어떤 목적을 두고 검색하려고 하는지 생각해보고, 그 목적에 부합하는 서치 결과를 얻으려면 어떤 키워드로 검색을 해야 할 지 잘 생각해 보면 좋을 것 같아요.
2. 논문 검색 목적에 따른 논문 검색 방법
2.1. 막연한 상태에서 특정 분야를 공부하고자 하는 상태
<분야>라는 단어는 참~~! 애매합니다. 학부생, 석사과정, 박사과정, 포닥, 교수, 교양과학교수 등 각자가 바라보는 분야의 범위가 천차만별입니다. 이를테면 A라는 사람이 우리 학교 줄기세포랩으로 진학 예정이라고 줄기세포 논문을 한 트럭 본 들 A가 원하는 랩에 진학해서 자신이 봤던 논문과 유사한 주제를 연구하게 될 확률은 높지 않을 것이라고 봅니다. (물론 다다익선이라고 다양한 논문을 볼 수록 보는 눈도 틔이고 보다 많은 것들을 포괄해서 볼 수 있을 것이라는 데에 이견은 없습니다.) 그러므로 이 경우에는 막연한 상태에서 조금 벗어 나는 것이 우선일 것 같습니다.
정말 큰 틀에서의 어떤 분야 (줄기세포, 암 생물학, 생물정보학, 발생학 등-생물분야라 양해 바랍니다 ^^;)에 대해 궁금하다면 논문 보다는 도서관에 있는 대학서적 이라고 불리는 류의 교과서들을 보는 것이 좋습니다. 혹은 구글링을 통해 이런 과목들에 대해 진행되고있는 온라인 강의나 커리큘럼을 찾아 보고, 해당 커리큘럼에서 발견되는 키워드들을 1강부터 순차적으로 타겟으로 잡아 볼 수 있을 것 같습니다. 이런 과정을 통해 막연한 분야를 조금 더 구체화할 수 있습니다.
리뷰논문 검색은 검색하고자 하는 키워드 앞 / 뒤에 REVIEW 키워드를 추가하여 검색하면 쉽게 찾을 수 있습니다. REVIEW 키워드를 포함하고 검색해 나온 결과 중에서 원하는 키워드를 많이 포함한 (정확도 순)논문, 인용 수가 많은 논문을 기준으로 조금 더 좋은 / 전통적인 / 내가 찾고자 하는 목적에 부합하는 논문을 볼 수 있을 것으로 생각됩니다. ^^
2.1.1 특정 분야에 대한 공부를 계속하기 위한 논문 검색
이상의 방법으로 찾은 질 좋은 리뷰논문은 특정 분야에 대한 introduction으로 기능할 수 있는 논문일 수도 있겠고, 조금 더 심화된 내용을 보고있었다면 해당 분야에서의 리뷰논문 출판 시점에서의 최신의 기술들이 포함되어있을 수 있을 것입니다. 저는 대학원에 진학해서 이루어지는 공부 중의 묘미가 논문의 레퍼런스를 거슬러 올라가며 학습하는 것이라고 생각하는 사람입니다. 어떤 리뷰논문을 보게 되었다면, 실은 거기에서 멈추는 것이 아니라 대략의 개요를 파악하는 목적으로 활용하고, 그 개요에 해당하는 세부적인 내용, 기술적인 내용 들을 조금 더 깊이있게 알아보는 것이 바로 논문 학습의 재미 아닐까요?
뭐 이를테면, 생물정보학이라는 분야를 알고싶어서 커리큘럼을 찾아봤더니 NGS시퀀싱이라는 개념이 대부분의 강의 첫 강에 이루어져서 NGS 시퀀싱에 관한 리뷰논문을 봅니다. NGS 데이터가 어떤 방식으로 생성되는지에 대한 리뷰논문이 한 편 있어요, 네이쳐에서 나왔고 시퀀싱 방식과 어플리케이션까지, 그리고 그 이해를 위해 필요한 기본 개념들까지 자세하게 잘 서술되어 있습니다. 그러면 그 논문을 통해서 어떤 어떤 방식의 시퀀싱 기법이 있구나. 하고 마는 것이 아니라 몇 가지의 공부거리를 더 찾아낼 수 있어야 합니다. 개별 시퀀싱 방식의 개발과 함께 출판된 논문들을 거슬러 올라가서 확인 해 봅니다. 데이터 상의 특징, 생성 방법에서 만들어지는bias는 어떤 것이 있는지, 어떤 장 단점을 가지는지 등을 확인할 수 있고 조금 더 품을 팔면 해당 방식으로 생성된 데이터를 직접 확인해 볼 수 도 있을 것입니다. 또 다른 한 가지는 그 논문에서 쓰인 다양한 개념어들에 대한 학습을 하는 것입니다. 이전의 예시에 이어서 다양한 NGS 기법에 대한 논문이 있으면 해당 논문 상에서 분명 Sequencing read, paired-end, mate-pair 등의 개념어가 나올 것입니다. 이런 것들을 이런게 있구나 하고 넘기는 것이 아니라, 각각이 어떤 의미인지 파악하면 논문 자체에 대한 이해도를 높일 뿐 만 아니라 이후 연구에도 매우 큰 도움이 됩니다. 마주하는 데이터의 상태를 파악하고 각각에 대한 처리를 진행할 때에도 고려할 수 있는 사항을 한 수 먼저 알고 가는 거예요. 이런 상황이 이 분야에서만 발생하는 것은 아니겠지요. 세부적인 상황은 전공마다 다르겠지만요! 아무튼 결론은 논문은 아주 좋은 공부 재료이고 활용할 수록 얻을 수 있는 것이 많다.
2.2 연구를 시작하는 과정에서 내가 보고자 하는 주제와 연관되는, 참고할 법 한 레퍼런스 논문 검색
연구 주제를 새로 잡는 과정에서 실은 논문 검색이 아주 광범위하게 이루어져야 합니다. 어쩌면 이 단계에서는 가성비를 따진다는 것에 어폐가 있습니다. 잡고자 하는 주제를 기준으로 최대한 범위를 넓게 잡아서 어떤 관련된 연구들이 선행되어 있는지, 내가 세운 가설이 이미 다른 사람에 의해서 검증 시도가 된 적은 없는지, 기존 연구에 비해 내가 수행하고자 하는 연구가 어떤 contribution을 가질 수 있는지, 내가 보고있는 이 주제가 이 academy 내에서 논의될 가치가 있는지 등을 레퍼런스를 통해서 수집, 확인할 수 있을 것으로 보입니다.
앞서 가성비를 따진다는 것에 어폐가 있다고 했듯, 이 목적을 가진 상황이라면 최대한 다양한 레퍼런스들을 살펴야 할 것으로 생각됩니다. 다만 모든 것을 다 볼 수 없으니 최소한의 기준으로 설정하는 것이 도움이 될 것 같습니다. (1) 어느정도 신뢰도가 있는 저널에 publish 된 것이며, (2) 나름대로 저명도를 가진 저자 / 실험실에서 나온 논문이면 더 좋겠지요, (3) 인용수가 어느정도 되는 논문을 찾아보기 정도의 기준이 있을 수 있을 것 같습니다. 이런 기준을 만족한다면 조금 더 시간을 들여 읽을 필요성이 있을 테고, 또 특히 인용수가 높은 논문의 경우 해당 논문을 인용해간 최신의 논문들은 어떤 관점에서 해당 논문을 인용했는지, 현재 시점에서 같은 분야 내에서는 어떤 방향성의 연구가 이루어지고 있는지.. 살펴보면 좋을 것 입니다.
2.3 새로운 연구과제 제안을 위한 선행연구 검색하기
비슷하게 연구 주제를 정하는 목적이긴 하지만, 2.2 와는 조금 다른 맥락에서 선행연구를 검색하고, 내가 수행하고자 하는 연구주제의 독창성, 필요성 등에 대한 근거를 제시하기 위한 논문 검색이 필요한 경우가 있습니다. 2.2에서는 연구를 목적으로 폭넓은 공부를 위한 논문 검색이었다면, 본 절에서는 제안을 목적으로 하는 자료를 제작하기 위한 조금 더 전략적일 필요가 있는 논문 검색이 필요합니다.
가안으로 두고 있는 이 연구주제가 반드시 선택되어야 하는 이유를 아래와 같은 항목들을 고려해서 제시를 해야 하고, 그 와중에 적절한 참고문헌들이 제시되어야 합니다.
- 이렇게나 많은 연구 팀에 의해 이루어지고 있으므로 실질적으로 필요함
- 많은 연구팀들이 연구를 진행하고 있음에도 부족한 부분이 있고, 그러므로 나 또한 이 연구를 해야한다는 필요성 제안
- 그리고 이 주제 근처의 다른 연구들이 너무나 중요해서 일정 수준 이상의 저널에서 꾸준히 출판되어오고 있다는 것을 출판된 일련의 논문들로 제시할 수 있는 연구의 흐름과 방향성 제시
기본적으로 중요한 연구주제라는 것을 어필하는 과정에는 이 분야에 대해 일찍이 연구가 시작되었고 지금까지도 꾸준히 관련 연구가 진행되고 있다는 것을 보여줄 수 있을 것으로 보입니다. 이전 절에서 고전 이라고 칭했던 것과 같은 물꼬를 튼 많은 인용수를 가지는 논문에서부터, 같은 문제의식을 공유하는 최신 출판 논문을 인용하여 이 주제의 유의미함을 어필할 수 있습니다. 그리고 유사한 주제를 다루는 일련의 논문들이 양적으로 많다는 것에 더해 일정 수준 이상의 저널에서 꾸준히 다뤄지고 있다는 점 또한 은연중에 어필할 수 있는 요소일 것입니다. (쓰다 보니 노파심에, 제안서에서 가장 중요한 것은 연구 내용 입니다.)
이런 목적 하에서 논문을 검색할 때에는 구글 스콜라를 이용하는 것이 편리합니다. 키워드 정확도도 중요하지만, 연도별 출판물과 인용수를 한 눈에 확인할 수 있다는 점이 편리합니다. 최신 논문을 검색하거나, 고전에 해당하는 논문을 찾고 그 이후로 출판된 논문을 살펴볼 수 있고, 여러 논문 중 인용수가 눈에 띄게 높은 것들 순으로 살펴보면 보다 효율적으로 레퍼런스를 확인 할 수 있습니다.
2.4 방법론이나 기본적인 개념에 대한 검색
연구 방법론은 대개 찾고자 하는 대상이 명확한 경우가 많은 것 같아요. 이런 때 일 수록 고전을 보는게 한 큐에 핵심을 파악하는 방법이라고 생각합니다. 말이 고전이지 특정한 방법론을 개발하여 출판된 첫 논문을 의미합니다. 아무리 잘 정리된 것을 찾거나, 그 논문을 인용한 다른 논문을 보더라도 결국에는 그 첫 논문으로 돌아가게 되더라구요. 논문에 따라 application 논문과 methodology 개발 논문을 분리해서 출판하는 경우도 있는데, 이 경우에 특히 method를 자세히 설명한 원 논문을 잘 찾아서 공부하시는 것이 좋습니다. 저의 경우에는 어떤 프로그램을 이해하는 과정에서 p-value를 어떻게 구했는지, 그 의미가 뭔지를 파악하고 싶었는데, 그 프로그램의 튜토리얼, 매뉴얼에도 만족할 만한 답을 찾을 수 없었고, cite 하라고 되어있는 논문에서도 명확하게 제시하고 있지 않아서 괜한 커뮤니티 (BIOSTAR 등)을 다 뒤지고, 그 논문 인용한 다른 논문들 살펴보고 했는데 처음 봤던 그 프로그램에서 인용하라고 한 논문에서 알고리즘을 출판한 논문을 인용해서 작성이 되어있던 것을 뒤늦게 발견해서 결국 돌고 돌아 그 방법론을 처음 출판한 원전으로 돌아가게 되었어요. 이런 식의 시행착오를 최소화 할 수 있는 방법이 바로 원전, 고전 찾기 입니다.
3. 원하는 결과물을 얻기 위한 검색 팁
3.1 구글의 이미지 검색을 활용하기
연구를 하다 보면 글로 정리된 내용보다도 결과물을 잘 나타내는 figure을 통해 논문 내용을 쉬이 이해할 수 있는 경우가 왕왕 있었던 것 같아요. 같은 맥락에서 찾고자 하는 논문이 있을 때, 구글의 이미지 탭을 클릭해보면 글로 된 논문 제목이나, 키워드를 포함하는 abstract의 일부 보다도 관련된 논문에서 어떤 figure를 제시하는지 등을 확인해서 원하는 결과를 보다 정확하게 찾아낼 수 있습니다. 어떤 키워들을 검색하더라도 논문 제목이 바로 뜨거나, 문장 한 두 개가 검색하는 키워드를 포함하고 있다는 텍스트로 된 결과 뿐이어서 사실상 개별 링크들을 다 확인해보는 과정을 거쳐야하는데, 이미지 탭을 통해서 어떤 결과물들이 있는지 확인하면, 키워드를 넘어서 검색하고자 하는 내용을 어떤 논문이 포함하고있는지 더 빨리 정확하게 찾을 수 있다는 (똑같은 말을 두 번 한 것 같네요.ㅎㅎ) 말입니다.
이런 검색 방법은, 저의 경우에는 특정한 타입의 데이터를 가지고 어떤 분석을 해야 할 지 가 고민스러울 때 자주 사용하는 방법입니다. 대략 어떤 결과물이 생성된다는 것을 알고있는 상태에서 보다 활용도가 높은 방법일 거라고 생각합니다. 그리고 알고리즘 등을 학습 할 때에도 이미지를 통해 검색하면 줄글로 설명해둔 것 보다 읽고 받아들이기 용이한 컨텐츠에 접근하기 더 쉬워집니다. Slideshare같은 데에도 알게모르게 많은 정보들이 숨어있고, 유료학회 등록하지 않은 학회에서 발표되는 발표자료들이 slideshare 등에도 공유되곤 하니까요.
특정한 종류의 Figure을 찾는 데에도 이미지 검색이 아주 유용하게 활용될 수 있습니다.
3.2 영문으로 된 문서가 아직 익숙하지 않아 국문으로 된 레퍼런스를 찾는 경우
개개인 인터넷 사용자가 생성한 각종 이론에 대한 블로그 글 부터 공신력 있는 매체나 교육기관에서 제공하는 온라인 강의까지 인터넷엔 차고 넘치는 정보들이 있다는 점은 모두 다 알고 공감할 것입니다… 다만, 질 좋은 컨텐츠들은 많은 경우 영문으로 서비스되고 있습니다. (국문 컨텐츠가 질이 낮다는 말이 아니라는 것은 다들 아시지요.) 공용어(..) 라는 개념이 요새도 쓰이는지는 모르겠지만 하여튼 영어를 만국공통으로 쓰고 있으니 당연한 일이겠지요. 다만 지금 내가 무언가를 이해하기에도 벅찬 상황에 영어로 된 컨텐츠를 오롯이 내 것으로 만들기는 쉽지 않습니다.
이럴 때 겁색하는 키워드 말미에 한글 키워드를 붙여 주시면 좋습니다. (*아 이 때 검색하고자 하는 키워드는 영문을 기본으로 검색해 주는게 좋습니다.) 이를테면 Hidden Markov Model을 검색한다 치면, “Hidden Markov Model” 만 검색하는 것이 아니라 “Hidden Markov Model 개념”, “Hidden Markov Model 설명”, “HMM 이해하기” 등과 같이요. 엄청 디테일한 분야의 실험 protocol이나, 사용자가 적은 프로그램의 경우 적합한 컨텐츠를 찾기 어려울 수 있겠으나 많은 사람들이 각자가 공부한 내용을 바탕으로 재구성해서 컨텐츠를 재생산 하고 있고, 그 도움을 일정부분 받을수 있다는 이야기 입니다. 선배가 알려주는것과 같은 맥락이라고도 볼 수 있을 것 같아요. 이 때 메인 키워드는 영어를 그대로 쓰고 보조로 붙이는 키워드를 국문으로 쓰는 이유는, 조금 더 최신의 컨텐츠 혹은 영문으로부터 번역된 컨텐츠에 접근하기에 더 좋기 때문입니다. 그리고.. 영문 논문을 쓸 사람이라는 가정 하에 그런 키워드로 쓰이는 단어들을 국문 번역어로 접하는 것은 썩 좋지 않습니다.
저는 가끔 네이버 검색도 하곤 합니다. 가-끔 특정 개념을 다루는 국문 게시글이 구글에서는 안 나와도 오래 전에 작성된 네이버 블로그 글로 하나 있고 이러기도 하거든요..
3.3 검색하기에 좋은 키워드를 설정하기
어떤 목적을 두고 논문을 검색 하더라도 적당한 키워드 셀렉이 되지 않으면 검색 결과가 원하는 대로 나오지 않을 수 있습니다. 여기서 적당한 키워드란 무엇일까요? 새로운 학생을 자주 받다 보니 (제가 과거에 어땠는지는 잘 기억이 나지 않습니다만. ㅎㅎ) 이 뉴비 친구들이 생각보다 뭔가를 검색하는 데에 어려움을 겪고 있고, 내가 찾으면 나오던데? 하는 상황이 종종 벌어지는 것을 알았습니다. 무엇을 찾고자 하는지 말로 풀어서 얘기할 수는 있는데, 그것을 어떤 키워드로 요약해서 찾지 못하는 경우거나, 혹은 본인이 찾아야하는 것이 무엇인지 명확하지 않으니 그 변두리의 결과만을 얻을 수 있는 키워드로 검색을 하고 있던 경우가 잦았던 것으로 기억합니다.
2번 항목에서 얘기한 것처럼 검색의 목적을 명확히 하고, 그 대상을 구체화해 내는 과정이 선행되어야 합니다. 혹시 내가 무엇을 모르는 상태라 무엇을 찾아야 하는지 도저히 모르겠다면, 그 문제를 낸 주체에게 내가 (A) 를 알아보기 위해 (B) 를 찾아보면 맞느냐 하는 식으로 물어보는게 목적을 명확하게 하는 첫 단계 일테고, 그런 문제를 낸 주체가 따로 없는 경우라면 내가 알아보고자 하는 것이 무엇인지 명료하게 정리할 수 있어야 합니다. 그리고 명료하게 정리된 문장을 영문으로 검색을 하면 됩니다. 문장을 번역기로 돌려 완성된 영어 문장 형태로 찾을 필요도 없습니다. 그 문장 속 키워드를 적당히 나열, 필요한 부분에 적당한 조사를 사용해서 구색만 맞춰줘도 구글이 적당한 문서들을 뱉어 줍니다.
앞서 말했던 뉴비 친구들 얘기에서 종종 발견된 현상이 본인이 알아봐야 하는 대상이 < (A) 과정에서 (B)를 수행하는 (C) 의 역할 > 정도의 문장으로 정리될 수 있는 상황이라면 이 친구들은 (A), (B) 혹은 (C) 개별 키워드 만을 검색하는 것이었습니다. 경우에 따라서 그 (A), (B), (C)를 한글로 구글링 하는 친구도 있었던 것 같고요… 제일 기본은 영문으로 알고자 하는 대상 자체를 다 검색하는 것이라고 생각합니다. 국문 논문을 주로 보는 문사철 분야는 또 사정이 다르겠지만, (A), (B), (C) 모두를 함께 검색하면 보다 나은 검색결과를 얻을 수 있다는 점은 다르지 않을 것 같습니다.
'Graduate student and' 카테고리의 다른 글
진화 연구가 하고싶긴 한 거야? (0) | 2021.11.01 |
---|---|
생물정보학 잡탕 블로그 (0) | 2021.09.08 |
내 박사과정에 대해 주변 사람들이 알아주었으면 하는 것들 (0) | 2021.07.19 |
글또 6기 다짐글 (1) | 2021.07.14 |
왜 나는 뒤쳐진 것 같은 기분이 들까 ? (0) | 2021.06.24 |