본문 바로가기

반응형

분류 전체보기

(69)
Methylome sequencing data 처리 워크플로우 차세대 시퀀싱 기술의 발달로~ 라는 서문을 많은 논문들이 사용해왔는데, 시퀀싱 기술의 발달은 비단 존재하는 DNA 분자의 염기서열을 밝히는 데에 그치지 않고, DNA 분자의 상태를 시퀀스 데이터 형태로 얻어낼 수 있게 했다. 그런 연구의 결실들이 다양한 종류의 프렙/call 과정을 변형시켜 만든 epigenetic feature 에 대한 시퀀싱 기법들이다. 생체 내의 특정한 상태를 데이터 형태로 얻고자 하는 연구 덕분에 염기서열을 밝히자 -> 발현량을 밝히자 -> 발현 기작을 밝히자 -> 발현 기작에 관여하는 특정한 염기서열, 단백질을 밝히자 하는 식으로 데이터를 활용한 연구의 영역이 점차 확장되고 있다. 오늘은 그러한 epigenetic feature 중에서도 DNA분자의 methylation 상태를 ..
DeepLGP: a novel deep learning method for prioritizing lncRNA target genes lncRNA Long non-coding RNA로 200nt 이상의 길이를 가지는 긴 RNA 분자이면서 단백질로 번역되지 않는 RNA를 의미한다. 생물체 내에서 lncRNA는 다양한 조절 기전에 참여하여 작용하는 것으로 밝혀졌는데, 다양한 조절 기전들은 다음과 같다. - Chromosomal silencing (염색체 침묵, 염색체 자체가 비활성화되는 작용) - Genomic imprinting (유전자 각인, 유전자의 발현 조절이 부모로부터의 원인에 의해 이루어지는 후성유전학적 현상) - Chromatin modification (염색질 구조 변형) - Transcriptional activation (전사 활성) - Transcriptional interference (전사 저해) - Nuclear ..
진화 연구가 하고싶긴 한 거야? 가만 보면 블로그 이름에도 이볼루션 어쩌고... 하고 있는데 대체 무슨 일일까? 계기가 있었나. 아주 없었던 것 같지는 않은데... 그리고 그 과거에는 나름 명분도 있고 열정도 있었는지 모르겠지만 어쩌면 지금은 각종 과제 수행을 위한 연구에 치이고 졸업은 또 언제하지 치이고 나서 헐 내거는 또 언제하지 하며 덩그러니 있는 내 개인과제를 절반은 안쓰러운 눈으로 절반은 맹목으로 바라보고 있는 나.. 스스로에게도 민망하지만서도 그럴싸하게 앵무새처럼 떠들고 있었던 게지. 누가 졸업 언제 하냐 물으면 짜증 낼 줄이나 알았지, 어렴풋한 상상 외에 커리어를 진지하게 고민해본 적은 없었던 것 같은데 어렴풋한 상상을 -거의 날 것 그대로- 남들 앞에 처음 내어놓는 경험을 하고 나니 이런 저런 생각이 들었다. 먼 미래라고..
FIMO: Find Individual Motif Occurrences 모티프 (Motif)는 유전체 내에서 생물학적 기능에 기여하는 짧은 DNA 서열이다. 생물체의 성장, 유지, 번식을 위해서 세포 수준에서 다양한 조절과정이 수반되고 그 조절과정에는 다수의 단백질이 관여한다. 단백질은 다양한 형태로 유전자의 발현 및 번역 과정을 조절하는데, 그 중 한 가지 방법은 DNA분자에 직접 결합하는 것이다. 단백질은 DNA 분자에 직접 결합함으로써 새로운 결합이나 다른 작용을 유발하거나, 억제함으로써 유전자의 발현을 조절한다. 이러한 과정에 참여하는 단백질을 Trnascription factor (TF, 전사인자) 라고 통칭하는데, 당연하게도 DNA의 아무 위치에 결합해서는 의도한 조절작용을 나타낼 수 없다. TF가 인식하여 부착하는 DNA의 염기서열을 찾은 것이 motif이고, ..
불균형 데이터 처리를 위한 7가지 Over Sampling 기법들 본 포스트는 아래 글을 번역한 것입니다. https://towardsdatascience.com/7-over-sampling-techniques-to-handle-imbalanced-data-ec51c8db349f 7 Over Sampling techniques to handle Imbalanced Data Deep dive analysis of various oversampling techniques towardsdatascience.com 불균형 데이터를 처리하는 것은 모델을 트레이닝 할 때 직면하게 되는 주요한 과제이다. 분류 대상인 레이블의 균형은 분류 모델을 트레이닝 하는 과정에서 중요한 역할을 하는데, 트레이닝 데이터셋 내의 레이블이 불균형 상태로 존재하는 경우, 모델은 트레이닝 데이터셋 내의..
[The biology of Cancer] 3. Tumor virus 바이러스는 광견병, 천연두, 감기 등 광범위하고 다양한 인간 질병의 원인이다. 바이러스 자체는 여과성 미생물로 분류되는 입자로 그 자체는 어떤 생명현상도 수행할 수 없어 생물체라고 볼 수 없지만, 이러한 바이러스가 숙주세포를 감염시키게 되면, 숙주세포 내부에서 스스로 증식하고 숙주세포를 사멸, 인근의 다른 세포로 숙주를 옮겨 주변 세포, 조직을 감염시키는 작용을 한다. 이를 통해 바이러스는 조직 전체로 신속히 퍼져나가고 질병 표현형을 유발하게 된다. 다양한 졸류의 질병을 유발하는 바이러스가 연구되고 밝혀져있는데, 어떤 바이러스는 숙주세포를 사멸시키는 대신 숙주세포의 세포주기 조절계를 망가뜨려 제어가 불가능할 정도의 증식을 유도하기도 한다. 이러한 보고는 바이러스에 의해 암 발생이 유도될 수 있다는 점을 ..
생물정보학 잡탕 블로그 그냥 보다 보니 ... 그런 생각이 드네 하하 처음 생각한 방향이 잡탕이었던 것은 아닌데 그냥 하면 된다. 그냥 안하기를 주로 택하는게 문제지만.. 졸업에 대한 위기의식과 여러가지를 이따금씩 스스로 돌이켜봐야 하겠다..
[The biology of Cancer] 2. Cancer의 본질 동물의 발생 과정은 수정란이라고 불리는 하나의 세포로부터 비롯된다. 수정란은 분열을 통해 배아를 형성하고 배아의 각 위치의 세포들은 각각 주어진 역할에 따라 특정 조직, 기관으로 분화하여 한 개체를 형성하게 된다. 수정란에는 모든 유전 정보가 담겨있고, 모든 종류의 세포로 분화할 수 있는 능력을 가졌다. 그리고 수정란이 분열되고 분화되어 만들어진 각 조직, 기관의 세포들에는 수정란이 가지고 있던 것과 동일한 양의 내용의 유전정보가 포함되어있다. 전체 유전정보를 포함하고 있는 세포는 그 자체로 다양한 기능을 할 수 있고 (다능성), 또 자립할 수 있는 세포 (자립성)라고 볼 수 있으나 세포가 위치하는 조직, 기관에 따라 각 세포들은 서로 다른 특징을 보인다. 이는 세포의 종류에 따라 동일한 유전정보로부터 ..
Si-C is a method for inferring super-resolution intact genome structure from single-cell Hi-C data Gene regulations and 3D structure 생물체 유전 정보의 총체인 유전체는 진핵생물의 핵 내에서 DNA 분자가 꼬이고 정리된 상태의 입체구조를 이룬 상태로 존재한다. 유전체가 가지는 입제 구조를 통해 유전체 상의 특정 지역끼리의 상호작용, 단백질을 매개로 하는 상호작용 들이 발생하고, 또 새로이 유도된다. 이러한 입체구조로 발생하는 고차원의 유전체 상호작용은 두 개 이상의 지역이 관여할 수 있고, 그 중 enhancer - promoter 간의 상호작용은 on-off 보다 양적으로 수치화가 가능하다고 알려져 있다. 이러한 DNA 입체 구조는 생물체 내 조직, 기관에 따라 그 패턴이 상이하며 각기 다른 조직/기관에서의 유전자 발현을 유도한다. 따라서 단일 세포 수준에서의 DNA 입체구..
3billion Bioinformatics Engineer 학부 학생 인턴십 https://3billion.io/company/careers Careers | 3billion 쓰리빌리언과 함께할 인재를 모십니다. 3billion.io

반응형