Cơ sở dữ liệu trình tự Ngân hàng gen (GenBank) là một truy cập mở, tập hợp chú thích của tất cả các chuỗi nucleotide có sẵn công khai và bản dịch protein của chúng.
Cơ sở dữ liệu này được sản xuất tại Trung tâm Thông tin Công nghệ sinh học Quốc gia (NCBI) như là một phần của Hợp tác Cơ sở dữ liệu Chuỗi Nucleotide Quốc tế, hoặc INSDC.
GenBank và các cộng tác viên của mình nhận được các chuỗi được sản xuất trong các phòng thí nghiệm trên khắp thế giới từ hơn 100.000 sinh vật khác biệt.
GenBank tiếp tục tăng trưởng với tốc độ theo cấp số nhân, tăng gấp đôi cứ sau 10 tháng.
Phiên bản 155, được sản xuất vào tháng 8 năm 2006, chứa hơn 65 tỷ cơ sở nucleotide trong hơn 61 triệu trình tự.
GenBank được xây dựng bằng cách đệ trình trực tiếp từ các phòng thí nghiệm riêng lẻ, cũng như từ các bài nộp số lượng lớn từ các trung tâm giải trình tự quy mô lớn.