Theo kịp bộ gen của con người

Nút nguồn: 1121568

Bộ gen của con người được tạo thành từ hơn ba tỷ cặp DNA cơ bản, từ đó tạo ra 23 cặp nhiễm sắc thể tạo nên mã di truyền của con người. Trình tự dự thảo ban đầu của bộ gen người đã được Celera Genomics và Hiệp hội giải trình tự bộ gen người quốc tế công bố vào tháng 2001 năm XNUMX. 

Ấn phẩm này đã mở đường cho những tiến bộ đáng kể trong hiểu biết khoa học về sinh học và bệnh tật của con người. Nhưng bản thảo ban đầu này vẫn chưa hoàn hảo. Một số thông tin không chính xác và một số phần của bộ gen không được sắp xếp theo trình tự. 

Vào năm 2019, Hiệp hội Telomere-to-Telomere (T2T Consortium) được thành lập, quy tụ các chuyên gia về gen với nhiều chuyên ngành phụ khác nhau để tập hợp và mô tả đặc điểm của 8% bộ gen còn lại. Được thành lập bởi nhà sinh học tính toán Adam Phillippy của Viện nghiên cứu bộ gen người quốc gia Hoa Kỳ và Đại học California, nhà di truyền học Karen Miga ở Santa Cruz, T2T cuối cùng đã mở rộng thành một nhóm gồm hơn 100 nhà khoa học.

Giờ đây, tập đoàn tuyên bố đã giải trình tự và tập hợp toàn bộ bộ gen của con người, vá lại những phần bị bỏ sót trong quá trình giải trình tự ban đầu cách đây hai thập kỷ.

Phillippy cho biết: “Chúng tôi đã tiết lộ 8% cuối cùng của bộ gen người và chắc chắn sẽ tìm thấy những khám phá mới trong phần quan trọng này của bộ gen”. “Trong lần vượt qua đầu tiên, chúng tôi đã phát hành một bộ năm bài báo đi kèm bổ sung để bắt đầu phân tích trình tự mới này. Đặc biệt, chúng tôi tập trung vào các bản sao phân đoạn mới được phát hiện, mảng vệ tinh trung tâm, các biến thể, phần tử có thể thay thế và cấu hình biểu sinh.”

Tác phẩm của họ đã được phát hành ra công chúng dưới dạng in trước vào tháng 5, có nghĩa là nó vẫn chưa được bình duyệt. Miga đã nói rằng cô ấy sẽ không coi thông báo này là chính thức cho đến khi bài báo cuối cùng được xuất bản trên một tạp chí y khoa. 

Bộ gen tham chiếu chính thức của con người hiện tại, GRCh38, được Hiệp hội tham chiếu bộ gen phát hành vào tháng 2013 năm 250. Bản dự thảo này chỉ chứa khoảng 2001 khoảng trống, trong đó phiên bản đầu tiên vào năm 150,000 có khoảng 250, nhưng 8 khoảng trống này vẫn chiếm khoảng XNUMX% tổng số. tổng thể bộ gen. 

Thay vào đó, nếu mô hình của Hiệp hội T2T (T2T-CHM13) được áp dụng, nó sẽ có ý nghĩa lớn đối với toàn bộ lĩnh vực gen.

Hiệp hội T2T đã hoàn thành công việc của mình như thế nào?

Các máy giải trình tự DNA tiêu chuẩn công nghiệp hiện nay, do Illumina sản xuất, lấy các đoạn DNA nhỏ và giải mã chúng trước khi tập hợp lại các kết quả. Điều này có tác dụng tốt với hầu hết bộ gen, nhưng không hiệu quả ở những phần mà mã DNA được tạo thành từ các mẫu dài và lặp lại. 

Nếu một máy tính phải ghép các mảnh nhỏ lại với nhau, hệ thống sẽ khó có thể ghép chúng lại theo đúng thứ tự khi tất cả chúng đều có vẻ giống hệt nhau. 

Nicolas Altemose, đồng nghiệp của Đại học California, Berkeley, một trong những nhà nghiên cứu chủ chốt của T2T, cho biết: “Các công nghệ giải trình tự DNA chỉ cho phép chúng tôi xác định trình tự của các đoạn DNA tương đối nhỏ, vì vậy để giải trình tự toàn bộ bộ gen, chúng tôi phải cắt nhỏ nó thành những phần nhỏ hơn, sắp xếp các phần nhỏ hơn rồi ghép chúng lại với nhau. 

“Điều này tương đối dễ dàng ở những phần của bộ gen có trình tự hoàn toàn độc đáo, nhưng nó thực sự khó khăn ở những vùng mà trình tự DNA giống nhau được tìm thấy lặp đi lặp lại. 

“Những vùng lặp đi lặp lại này giống như những mảnh bầu trời xanh trong trò chơi ghép hình, vì chúng thiếu các đặc điểm phân biệt giúp chúng ta đặt chúng một cách chính xác, khiến chúng trở thành những vùng khó ghép lại với nhau nhất”.

Altemose là tác giả chính của nhóm khám phá các thành phần lớn nhất của các vùng bị thiếu trước đây của bộ gen: các chuỗi lặp lại song song được tìm thấy trong và xung quanh tâm động của mỗi nhiễm sắc thể. Những trình tự này chiếm khoảng 6% bộ gen và một số trong chúng đóng vai trò thiết yếu trong quá trình phân chia tế bào.

Thay vì cắt nhỏ bộ gen và ghép lại, việc giải trình tự T2T-CHM13 được thực hiện nhờ các công nghệ được phát triển bởi hai công ty giải trình tự DNA tư nhân: Pacific Biosciences (PacBio) và Oxford Nanopore. 

Công nghệ PacBio và Oxford Nanopore không cắt DNA thành những mảnh nhỏ. Thay vào đó, công nghệ của PacBio sử dụng tia laser để kiểm tra nhiều lần cùng một chuỗi DNA, tạo ra kết quả có độ chính xác cao. Trong khi đó, công nghệ Oxford Nanopore chạy các phân tử DNA qua các lỗ nhỏ, tạo thành một chuỗi rất dài. Những nền tảng này cho phép các nhà nghiên cứu sắp xếp các đoạn DNA lớn hơn nhiều cùng một lúc, đơn giản hóa câu đố.

Phillippy cho biết: “Cho đến gần đây, các phương pháp giải trình tự DNA không có sự kết hợp cần thiết giữa độ chính xác và độ dài đọc để giải trình tự và lắp ráp thành công các phần lặp lại nhiều nhất của bộ gen. 

“Giờ đây, chúng tôi có thể sắp xếp 20,000 cặp cơ sở trở lên cho mỗi lần đọc với độ chính xác rất cao, chúng tôi đã có thể vượt qua những thách thức còn lại”.

Trình tự DNA mà các nhà nghiên cứu T2T sử dụng không phải từ một người mà là một nốt ruồi hydatidiform, một sự phát triển xảy ra trong tử cung của phụ nữ khi tinh trùng thụ tinh với trứng không có nhân. Điều này có nghĩa là nó chứa hai bản sao của 23 nhiễm sắc thể giống nhau, thay vì hai bộ nhiễm sắc thể khác nhau, khiến nỗ lực tính toán tạo ra chuỗi DNA trở nên đơn giản hơn.

Nhìn chung, các nhà nghiên cứu đã thêm hoặc cố định hơn 200 triệu cặp bazơ trong bộ gen tham chiếu, phát hiện ra rằng bộ gen của con người có chiều dài khoảng 3.05 tỷ cặp bazơ. 

Trình tự mới bao gồm năm nhánh nhiễm sắc thể hoàn toàn bị thiếu trong các trình tự tham chiếu trước đây và các dãy vệ tinh trung tâm cho tất cả các nhiễm sắc thể. Những trình tự mới được phát hiện này hiện có thể được nghiên cứu để hiểu rõ hơn về chức năng và mối liên hệ tiềm tàng của chúng với bệnh tật.

Điều này có ý nghĩa gì đối với phòng thí nghiệm lâm sàng?

Altemose cho biết: “Với tổ hợp T2T, các vảy đã rơi khỏi mắt chúng tôi và cuối cùng chúng tôi đã có thể quan sát cấu trúc chi tiết của các vùng rộng lớn của bộ gen mà trước đây có đặc điểm rất kém. Điều này đã tiết lộ những hiểu biết mới về cách các vùng lặp lại lớn phát triển trong bộ gen của con người, cùng với việc phát hiện ra các họ lặp lại mới và các gen mới trong các vùng này. 

“Thật thú vị, tổ hợp này cũng mở ra những vùng còn thiếu trước đây để nghiên cứu bằng cách sử dụng các phương pháp thử nghiệm hiện đại có thể tiết lộ cách chúng khác nhau ở mỗi người và cách chúng hoạt động trong tế bào người.”

Cách tiếp cận mới này có thể có tác động đáng kể đến các dự án gen trong phòng thí nghiệm lâm sàng khi nói đến việc giải trình tự toàn bộ bộ gen cho từng bệnh nhân, đặc biệt là những người nghi ngờ mắc hoặc đã được chẩn đoán mắc một bệnh di truyền hiếm gặp. 

Hiện tại, các vùng bị thiếu trong tập hợp bộ gen vẫn được sắp xếp theo trình tự trong quá trình này nhưng sau đó sẽ không thể căn chỉnh hoặc căn chỉnh không phù hợp với vùng trùng khớp gần nhất của chúng trong tham chiếu. 

Altemose cho biết: “Điều này có thể dẫn đến các cuộc gọi biến thể dương tính giả trong các vùng được tập hợp của bộ gen và nó bỏ qua các biến thể có khả năng liên quan đến lâm sàng ở các phần còn thiếu của tập hợp bộ gen. Một nhóm trong Hiệp hội T2T đã khám phá cách tổ hợp T2T mới cải thiện khả năng gọi biến thể bằng cách sử dụng bộ dữ liệu giải trình tự lớn từ nhiều cá nhân.”

Các nhà nghiên cứu đã nhận thấy sự sụt giảm đặc biệt lớn trong các cuộc gọi biến thể dương tính giả ở 269 gen có liên quan về mặt y tế trong và xung quanh một số vùng mới được cải thiện của bộ gen.

Phillippy nói: “Điều này rõ ràng sẽ cải thiện tính chính xác của các nghiên cứu liên quan đến những gen này. Tuy nhiên, nhìn về lâu dài, tôi rất vui mừng về khả năng phát hiện ra các gen mới và mối liên hệ giữa bệnh tật trong hơn 200 triệu cơ sở trình tự mà chúng tôi đã thêm vào.”

Mặc dù T2T-CHM13 vẫn chưa được sử dụng làm bộ gen tham chiếu chính thức nhưng một số nhà nghiên cứu đã bắt đầu sử dụng nó trong công việc của họ. Giám đốc khoa ung thư phân tử của Bệnh viện Nhi đồng Mercy, Tiến sĩ Midhat Farooqui đã bắt đầu sử dụng bộ gen cho nghiên cứu của mình về các bệnh hiếm gặp ở trẻ em, sắp xếp DNA từ bệnh nhân của mình dựa trên những khoảng trống hiện đã được lấp đầy để tìm kiếm các đột biến chưa được phát hiện trước đó.

Phillippy cho biết: “Sẽ phải mất nhiều năm nghiên cứu để hiểu được chức năng hoặc tác dụng tiềm tàng của các trình tự này, nhưng những phát hiện đó sẽ giúp hoàn thiện sự hiểu biết của chúng ta về bộ gen và cuối cùng được đưa vào lâm sàng”.

Nguồn: https://www.medicaldevice-network.com/features/keeping-up-with-the-human-genome/

Dấu thời gian:

Thêm từ Phán quyết thiết bị y tế