Gộp nhiều file Excel là cách đưa dữ liệu rải rác ở nhiều tệp về một bảng tổng hợp, giúp bạn đối soát, báo cáo và phân tích nhanh hơn mà không phải copy–paste thủ công.
Ngoài việc “gom về một chỗ”, nhu cầu phổ biến còn là gộp theo chuẩn cột, tự cập nhật khi có file mới, và giữ được lịch sử xử lý để dễ kiểm tra sai lệch.
Trong thực tế, bạn có thể gặp đủ biến thể: file khác tên cột, thừa/thiếu sheet, định dạng ngày giờ lộn xộn, hoặc dữ liệu trùng gây lệch tổng.
Giới thiệu ý mới: Dưới đây là các cách gộp nhiều file Excel theo từng tình huống (nhanh – bền – tự động), kèm checklist chuẩn bị và mẹo xử lý lỗi thường gặp.
Gộp nhiều file Excel là gì và khi nào nên làm?
Gộp nhiều file Excel là thao tác hợp nhất (append) dữ liệu từ nhiều workbook vào một bảng “master”, phù hợp khi bạn có nhiều báo cáo tháng/tuần hoặc nhiều phòng ban gửi file cùng cấu trúc.
Tiếp theo, để chọn đúng cách gộp, bạn cần phân biệt rõ “gộp dữ liệu” và “gộp nội dung hiển thị”:
- Gộp dữ liệu (append): nối thêm dòng từ nhiều file vào 1 bảng chung (phổ biến nhất).
- Gộp theo khóa (merge/join): ghép cột theo mã (Mã KH/Mã SP) để bổ sung thông tin, tránh nhân bản dòng.
- Gộp tổng hợp (consolidate): cộng/đếm/tổng hợp theo vùng dữ liệu, dùng khi bạn chỉ cần chỉ tiêu.
Quan trọng hơn, việc gộp giúp giảm sai sót do thao tác thủ công: copy sai vùng, dán lệch cột, bỏ sót file. Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả đã phân tích hàng chục nghìn trường dữ liệu và cho thấy sai số nhập/chuyển dữ liệu có thể phát sinh đáng kể nếu quy trình không được kiểm soát.

Cần chuẩn bị gì để gộp file không lỗi?
Để gộp nhiều file Excel “mượt”, bạn cần chuẩn hóa tối thiểu schema (tên cột – kiểu dữ liệu – ý nghĩa), rồi mới chọn công cụ gộp phù hợp.
Sau đây là checklist chuẩn bị, ưu tiên làm theo thứ tự để tránh lỗi dây chuyền:
Chuẩn hóa cột: tên cột phải “đúng nghĩa”, không chỉ “đúng nhìn”
Cụ thể, hãy thống nhất tên cột (VD: Ngay, Ngày, Date → chọn 1), tránh dấu cách thừa, ký tự đặc biệt, hoặc cột trùng tên. Nếu cột có cùng nghĩa nhưng khác tên, công cụ gộp có thể tạo thêm cột mới dẫn tới “tách dữ liệu” vô tình.
Để minh họa, bạn nên giữ nguyên 1 dòng tiêu đề, không chèn dòng mô tả phía trên bảng dữ liệu; nếu cần mô tả, hãy để ở sheet riêng.

Đặt cấu trúc thư mục và quy tắc đặt tên file
Ví dụ, tạo 1 thư mục “Input” chỉ chứa file cần gộp; tránh để file rác, file backup, hoặc file tạm vì công cụ có thể “nhặt” hết mọi thứ trong thư mục. Microsoft cũng khuyến nghị để tất cả file cần gộp trong một thư mục chuyên dụng và hạn chế file ngoài luồng.

Chốt kiểu dữ liệu ngay từ đầu
Quan trọng hơn, hãy xác định cột nào là text (mã đơn), cột nào là number, cột nào là date. Nếu bạn để “tự đoán” kiểu dữ liệu, khi gộp nhiều nguồn Excel, cột ngày rất dễ bị đổi sang text hoặc số seri, kéo theo sai báo cáo.
Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả sử dụng cách đo lỗi theo “lỗi trên 10.000 trường”, nhấn mạnh rằng kiểm soát quy trình và kiểm tra nhất quán giúp giảm lỗi phát sinh khi chuyển/nhập dữ liệu.

Cách gộp nhiều file Excel bằng Power Query theo thư mục
Cách bền nhất để gộp nhiều file Excel là dùng Power Query với nguồn From Folder: bạn thiết lập một lần, sau đó chỉ cần thêm file mới vào thư mục và bấm Refresh để cập nhật.
Tiếp theo, làm theo quy trình 6 bước dưới đây để vừa gộp, vừa giữ khả năng tự động hóa:
Bước 1: Chuẩn bị thư mục “Input” và file mẫu
Hãy đặt 1 file “mẫu chuẩn” (có đủ cột và kiểu dữ liệu) vào thư mục cùng các file cần gộp. Mục tiêu là giúp Power Query nhận diện schema ổn định ngay từ lần đầu.

Bước 2: Data → Get Data → From File → From Folder
Cụ thể, bạn trỏ đến thư mục Input để Power Query liệt kê toàn bộ file. Trong màn hình preview, bạn sẽ thấy danh sách file; đây là “cửa kiểm soát” để chắc chắn không có file thừa bị gộp nhầm.

Bước 3: Chọn Combine & Transform để kiểm soát dữ liệu trước khi nạp
Để bắt đầu, ưu tiên “Combine & Transform” thay vì “Combine & Load” nếu bạn cần làm sạch (trim, chuẩn ngày, loại dòng trống, đổi kiểu dữ liệu). Power Query sẽ chọn một sample file để học cấu trúc và dựng bước gộp.

Bước 4: Chuẩn hóa trong Power Query Editor
Ví dụ, dùng các thao tác: Remove Empty Rows, Trim/Clean, Change Type, Replace Values, và kiểm tra Applied Steps để tránh bước thừa. Power Query có giao diện Editor riêng, hỗ trợ bạn xem rõ từng bước biến đổi dữ liệu.

Bước 5: Close & Load (hoặc Load To…) để đổ về bảng master
Quan trọng hơn, nếu file tổng hợp sẽ dùng Pivot/Power Pivot/BI, hãy Load To… và chọn Table + tạo kết nối (connection) để nhẹ file và dễ refresh.

Bước 6: Refresh khi có file mới
Dưới đây là điểm “ăn tiền”: chỉ cần thả thêm file vào thư mục và bấm Refresh, dữ liệu sẽ tự gộp lại theo đúng pipeline. Microsoft mô tả rõ mô hình “combine nhiều file cùng schema trong 1 folder và refresh để cập nhật” như một kịch bản tiêu chuẩn.

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả đã làm việc với dữ liệu quy mô lớn (gần 20.000 trường) và nhấn mạnh tầm quan trọng của quy trình kiểm tra để hạn chế lỗi khi chuyển dữ liệu; vì vậy, thiết lập pipeline gộp + refresh nhất quán thường an toàn hơn thao tác thủ công.
Video minh họa thao tác gộp file theo thư mục bằng Power Query.
Khi nào nên gộp bằng Copy–Paste hoặc Consolidate?
Có, bạn vẫn có thể gộp nhiều file Excel bằng copy–paste hoặc Consolidate nếu dữ liệu ít, chỉ làm một lần, và yêu cầu kiểm soát đơn giản; nhưng đổi lại rủi ro bỏ sót và sai lệch cao hơn khi khối lượng tăng.
Tiếp theo, bảng dưới đây giúp bạn chọn phương pháp theo tình huống, để tránh “dùng dao mổ trâu để giết gà” hoặc ngược lại.
Bảng này chứa tiêu chí chọn phương pháp gộp theo nhu cầu (tự động, sạch dữ liệu, ít lỗi) và khối lượng file.
| Phương pháp | Phù hợp khi | Điểm mạnh | Rủi ro |
|---|---|---|---|
| Power Query (From Folder) | Gộp định kỳ, nhiều file, cần refresh | Tự động, lưu bước xử lý, dễ mở rộng | Cần chuẩn schema, học thao tác ban đầu |
| Copy–Paste | Ít file, làm 1 lần, dữ liệu nhỏ | Nhanh, không cần thiết lập | Dễ dán lệch cột, bỏ sót file, khó audit |
| Consolidate | Chỉ cần tổng hợp chỉ tiêu | Nhanh ra tổng | Không tạo “bảng master” để phân tích sâu |
Quan trọng hơn, nghiên cứu về lỗi spreadsheet cho thấy lỗi là phổ biến và không nhỏ; vì vậy khi quy trình lặp lại, bạn nên chuyển sang cách gộp có thể kiểm soát và kiểm tra được (như pipeline).

Cách gộp nhiều file Excel bằng VBA/Macro khi cấu trúc cố định
Nếu bạn cần gộp nhanh trên máy nội bộ, cấu trúc file cố định (cùng sheet, cùng cột, cùng vùng dữ liệu), thì Macro/VBA là lựa chọn “tốc độ” để tự động mở file, copy vùng, và dán vào master. Tuy nhiên, cách này phụ thuộc nhiều vào việc file không đổi cấu trúc.
Tiếp theo, thay vì dán code dài, bạn có thể triển khai theo hướng “ít rủi ro” như sau:
Tạo template master và quy định vùng dữ liệu
Cụ thể, thống nhất dữ liệu luôn nằm trong một Table (Ctrl+T) tên cố định, ví dụ T_Data. Khi đó macro chỉ cần đọc Table theo tên, hạn chế sai vùng.

Dùng Macro Recorder cho thao tác lặp đơn giản, rồi tinh chỉnh
Để bắt đầu, ghi macro cho 1 file mẫu: mở file → copy Table → dán vào master (Append). Sau đó mới lặp theo danh sách file trong thư mục. Bạn nên thêm bước kiểm tra “file đang mở” và “Table tồn tại” để tránh macro chạy sai.

Thiết lập cơ chế audit: cột nguồn và thời gian gộp
Quan trọng hơn, hãy thêm 2 cột vào master: SourceFile và ImportedAt. Nhờ vậy, khi phát hiện lệch số, bạn truy ngược được file nào gây sai.
Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả đo lỗi theo “lỗi trên 10.000 trường”, cho thấy kiểm tra nhất quán và đối chiếu giúp giảm lỗi; cơ chế audit trong file master đóng vai trò tương tự kiểm tra nhất quán.

Gộp dữ liệu từ nhiều sheet trong một workbook
Nếu dữ liệu nằm trong một file nhưng rải ở nhiều sheet (VD: Tháng 1…Tháng 12), bạn có thể gộp theo 2 hướng: Power Query “From Workbook” để append nhiều sheet, hoặc chuẩn hóa thành 1 Table rồi phân tích bằng Pivot.
Tiếp theo, hãy chọn theo mục tiêu:
- Cần bảng master chi tiết: append các sheet về 1 Table, thêm cột “Tháng/SheetName”.
- Chỉ cần tổng: Consolidate/Pivot để ra chỉ tiêu theo tháng.
Mẹo: đưa dữ liệu về “Table chuẩn” trước khi gộp
Cụ thể, biến từng sheet thành Table sẽ giúp bạn không bị lệch vùng khi thêm dòng mới. Ngoài ra, tránh bố trí nhiều bảng lộn xộn trong một sheet vì dễ gây hiểu sai dữ liệu khi xử lý tự động.

Mẹo: thêm cột ngữ cảnh để không mất “nguồn” sau khi gộp
Ví dụ, thêm cột Period (tháng/quý) hoặc SheetName để khi lọc Pivot bạn không bị “một đống dữ liệu vô danh”. Đây là cách giữ ngữ cảnh mà vẫn gộp gọn.

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, việc đối chiếu sai khác giữa các bộ dữ liệu được thực hiện bằng so sánh có hệ thống; thêm cột ngữ cảnh là nền tảng để bạn đối chiếu khi dữ liệu đã gộp.
Xử lý các tình huống khó: khác cột, trùng dữ liệu, lỗi định dạng
Khi gộp nhiều file Excel, các lỗi “đau đầu” thường không nằm ở thao tác gộp mà nằm ở độ không đồng nhất giữa file: thiếu cột, sai kiểu dữ liệu, tên sheet khác, hoặc dữ liệu trùng.
Tiếp theo, hãy xử theo từng nhóm lỗi để không “chữa cháy” lan man:
Khác cột/thiếu cột: ưu tiên chuẩn theo cột “bắt buộc”
Cụ thể, xác định nhóm cột bắt buộc (mã, ngày, số tiền…) và nhóm cột tùy chọn. Trong Power Query, bạn có thể chọn cột theo danh sách chuẩn, thiếu thì để null; sau đó kiểm tra file nào thiếu để yêu cầu bổ sung.

Lỗi ngày tháng: chuẩn hóa locale và dùng transform nhất quán
Ví dụ, 01/02 có thể là 1 Feb hoặc 2 Jan tùy hệ. Cách an toàn là ép kiểu bằng “Using Locale” trong Power Query hoặc chuyển đổi theo định dạng ISO (YYYY-MM-DD) ở đầu pipeline.

Trùng dữ liệu: xác định khóa trùng trước khi Remove Duplicates
Quan trọng hơn, đừng xóa trùng “cả dòng” nếu dữ liệu có thể khác ở cột phụ. Hãy tạo khóa như (Mã + Ngày + Số chứng từ) rồi xóa trùng theo khóa để không mất bản ghi hợp lệ.

File lỗi/khác sheet: tách luồng “error handling”
Để bắt đầu, bạn nên lọc file theo phần mở rộng, bỏ file tạm (~$), và trong Power Query tạo bước kiểm tra “sheet/table tồn tại”. Nếu file không đạt, đưa vào danh sách lỗi để xử thủ công thay vì làm hỏng toàn bộ pipeline.
Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, sai số được phát hiện bằng so sánh và gắn nhãn lỗi theo nhóm; vì vậy, tách luồng xử lý lỗi (error handling) giúp bạn khoanh vùng và không làm lan lỗi sang dữ liệu tốt.

Mở rộng: tự động hóa quy trình sau khi gộp để dùng lâu dài
Để dùng “bảng master” bền, bạn nên bổ sung lớp tự động hóa: refresh, kiểm tra, và chia sẻ đầu ra đúng mục đích.
Tự refresh và tối ưu hiệu năng file master
Cụ thể, bạn có thể thiết lập refresh trong Properties (Queries & Connections) để cập nhật khi mở file; đồng thời chỉ load các bảng cần thiết để giảm dung lượng. Trong thực hành, Power Query ghi lại từng bước biến đổi, giúp bạn tái sử dụng và cập nhật thay vì làm lại từ đầu.

Chuẩn hóa đầu ra cho chia sẻ và lưu trữ
Ví dụ, sau khi gộp xong, bạn nên khóa cấu trúc cột, đặt tên bảng rõ ràng, và tách “Input/Output” để người khác không vô tình sửa pipeline. Nếu bạn làm việc nhóm, hãy thống nhất quy ước để giảm lỗi do “mỗi người một kiểu”.

Liên quan thao tác văn phòng khác (không chỉ Excel)
Ngoài gộp dữ liệu, trong quy trình làm việc thực tế, bạn có thể cần gộp nhiều file Word thành 1 để nộp báo cáo, hoặc chuẩn hóa file tổng hợp trước khi gửi đi trong bộ phần mềm văn phòng quen thuộc; khi in báo cáo, nhiều người cũng hay tìm cách in Excel vừa trang A4 để tránh bị tràn cột. Những việc này thường đi kèm với thói quen dùng các phần mềm thông dụng trong doanh nghiệp, nên việc chuẩn hóa đầu ra ngay từ bước gộp sẽ tiết kiệm công về sau.

Nguồn tải/cập nhật công cụ (chính thức)
Nếu bạn cần tài liệu chính thức về Power Query và tính năng combine files: https://support.microsoft.com (tìm “Import data from a folder with multiple files (Power Query)”) và https://learn.microsoft.com (tìm “Combine files overview”).
Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, cách đo lỗi theo chuẩn “errors per 10,000 fields” nhấn mạnh giá trị của kiểm soát quy trình; vì vậy, tài liệu hóa và chuẩn hóa pipeline sau khi gộp là bước giúp bạn duy trì chất lượng dữ liệu lâu dài.

FAQ (Các câu hỏi thường gặp)
Power Query có gộp được file khác số dòng không?
Có. Miễn là cùng schema (cùng tên cột/ý nghĩa), số dòng mỗi file có thể khác nhau; Power Query sẽ append thành một bảng dài.
Gộp xong rồi, thêm file mới có tự vào bảng không?
Nếu bạn gộp theo thư mục bằng Power Query, thêm file mới vào thư mục rồi Refresh là dữ liệu cập nhật; đây là ưu điểm lớn so với copy–paste.
File có tên sheet khác nhau thì xử lý sao?
Cách ổn nhất là chuẩn hóa tên sheet/table trong các file nguồn. Nếu không thể, hãy tạo bước điều kiện trong Power Query để chọn đúng sheet theo quy tắc (ví dụ sheet chứa tiêu đề chuẩn), và đưa file “không đạt” vào danh sách lỗi để xử riêng.
Nên chọn Power Query hay VBA?
Power Query mạnh khi bạn cần lặp lại + refresh + làm sạch. VBA phù hợp khi cấu trúc cố định, thao tác đơn giản, và bạn cần chạy nhanh theo kịch bản nội bộ; tuy nhiên vẫn nên thêm cột audit để truy nguồn khi có sai lệch.

