Gộp nhiều file Excel: hướng dẫn hợp nhất cho dân văn phòng

power query excel 365

Gộp nhiều file Excel là cách đưa dữ liệu rải rác ở nhiều tệp về một bảng tổng hợp, giúp bạn đối soát, báo cáo và phân tích nhanh hơn mà không phải copy–paste thủ công.

Ngoài việc “gom về một chỗ”, nhu cầu phổ biến còn là gộp theo chuẩn cột, tự cập nhật khi có file mới, và giữ được lịch sử xử lý để dễ kiểm tra sai lệch.

Trong thực tế, bạn có thể gặp đủ biến thể: file khác tên cột, thừa/thiếu sheet, định dạng ngày giờ lộn xộn, hoặc dữ liệu trùng gây lệch tổng.

Giới thiệu ý mới: Dưới đây là các cách gộp nhiều file Excel theo từng tình huống (nhanh – bền – tự động), kèm checklist chuẩn bị và mẹo xử lý lỗi thường gặp.

Mục lục

Gộp nhiều file Excel là gì và khi nào nên làm?

Gộp nhiều file Excel là thao tác hợp nhất (append) dữ liệu từ nhiều workbook vào một bảng “master”, phù hợp khi bạn có nhiều báo cáo tháng/tuần hoặc nhiều phòng ban gửi file cùng cấu trúc.

Tiếp theo, để chọn đúng cách gộp, bạn cần phân biệt rõ “gộp dữ liệu” và “gộp nội dung hiển thị”:

  • Gộp dữ liệu (append): nối thêm dòng từ nhiều file vào 1 bảng chung (phổ biến nhất).
  • Gộp theo khóa (merge/join): ghép cột theo mã (Mã KH/Mã SP) để bổ sung thông tin, tránh nhân bản dòng.
  • Gộp tổng hợp (consolidate): cộng/đếm/tổng hợp theo vùng dữ liệu, dùng khi bạn chỉ cần chỉ tiêu.

Quan trọng hơn, việc gộp giúp giảm sai sót do thao tác thủ công: copy sai vùng, dán lệch cột, bỏ sót file. Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả đã phân tích hàng chục nghìn trường dữ liệu và cho thấy sai số nhập/chuyển dữ liệu có thể phát sinh đáng kể nếu quy trình không được kiểm soát.

power query excel 365

Cần chuẩn bị gì để gộp file không lỗi?

Để gộp nhiều file Excel “mượt”, bạn cần chuẩn hóa tối thiểu schema (tên cột – kiểu dữ liệu – ý nghĩa), rồi mới chọn công cụ gộp phù hợp.

Sau đây là checklist chuẩn bị, ưu tiên làm theo thứ tự để tránh lỗi dây chuyền:

Chuẩn hóa cột: tên cột phải “đúng nghĩa”, không chỉ “đúng nhìn”

Cụ thể, hãy thống nhất tên cột (VD: Ngay, Ngày, Date → chọn 1), tránh dấu cách thừa, ký tự đặc biệt, hoặc cột trùng tên. Nếu cột có cùng nghĩa nhưng khác tên, công cụ gộp có thể tạo thêm cột mới dẫn tới “tách dữ liệu” vô tình.

Để minh họa, bạn nên giữ nguyên 1 dòng tiêu đề, không chèn dòng mô tả phía trên bảng dữ liệu; nếu cần mô tả, hãy để ở sheet riêng.

Đặt cấu trúc thư mục và quy tắc đặt tên file

Ví dụ, tạo 1 thư mục “Input” chỉ chứa file cần gộp; tránh để file rác, file backup, hoặc file tạm vì công cụ có thể “nhặt” hết mọi thứ trong thư mục. Microsoft cũng khuyến nghị để tất cả file cần gộp trong một thư mục chuyên dụng và hạn chế file ngoài luồng.

excel power query

Chốt kiểu dữ liệu ngay từ đầu

Quan trọng hơn, hãy xác định cột nào là text (mã đơn), cột nào là number, cột nào là date. Nếu bạn để “tự đoán” kiểu dữ liệu, khi gộp nhiều nguồn Excel, cột ngày rất dễ bị đổi sang text hoặc số seri, kéo theo sai báo cáo.

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả sử dụng cách đo lỗi theo “lỗi trên 10.000 trường”, nhấn mạnh rằng kiểm soát quy trình và kiểm tra nhất quán giúp giảm lỗi phát sinh khi chuyển/nhập dữ liệu.

ghep n file excel thanh nhieu file 0cd7106b

Cách gộp nhiều file Excel bằng Power Query theo thư mục

Cách bền nhất để gộp nhiều file Excel là dùng Power Query với nguồn From Folder: bạn thiết lập một lần, sau đó chỉ cần thêm file mới vào thư mục và bấm Refresh để cập nhật.

Tiếp theo, làm theo quy trình 6 bước dưới đây để vừa gộp, vừa giữ khả năng tự động hóa:

Bước 1: Chuẩn bị thư mục “Input” và file mẫu

Hãy đặt 1 file “mẫu chuẩn” (có đủ cột và kiểu dữ liệu) vào thư mục cùng các file cần gộp. Mục tiêu là giúp Power Query nhận diện schema ổn định ngay từ lần đầu.

power query excel 365

Bước 2: Data → Get Data → From File → From Folder

Cụ thể, bạn trỏ đến thư mục Input để Power Query liệt kê toàn bộ file. Trong màn hình preview, bạn sẽ thấy danh sách file; đây là “cửa kiểm soát” để chắc chắn không có file thừa bị gộp nhầm.

excel power query

Bước 3: Chọn Combine & Transform để kiểm soát dữ liệu trước khi nạp

Để bắt đầu, ưu tiên “Combine & Transform” thay vì “Combine & Load” nếu bạn cần làm sạch (trim, chuẩn ngày, loại dòng trống, đổi kiểu dữ liệu). Power Query sẽ chọn một sample file để học cấu trúc và dựng bước gộp.

ghep n file excel thanh nhieu file 0cd7106b

Bước 4: Chuẩn hóa trong Power Query Editor

Ví dụ, dùng các thao tác: Remove Empty Rows, Trim/Clean, Change Type, Replace Values, và kiểm tra Applied Steps để tránh bước thừa. Power Query có giao diện Editor riêng, hỗ trợ bạn xem rõ từng bước biến đổi dữ liệu.

excel power query

Bước 5: Close & Load (hoặc Load To…) để đổ về bảng master

Quan trọng hơn, nếu file tổng hợp sẽ dùng Pivot/Power Pivot/BI, hãy Load To… và chọn Table + tạo kết nối (connection) để nhẹ file và dễ refresh.

power query excel 365

Bước 6: Refresh khi có file mới

Dưới đây là điểm “ăn tiền”: chỉ cần thả thêm file vào thư mục và bấm Refresh, dữ liệu sẽ tự gộp lại theo đúng pipeline. Microsoft mô tả rõ mô hình “combine nhiều file cùng schema trong 1 folder và refresh để cập nhật” như một kịch bản tiêu chuẩn.

excel power query

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả đã làm việc với dữ liệu quy mô lớn (gần 20.000 trường) và nhấn mạnh tầm quan trọng của quy trình kiểm tra để hạn chế lỗi khi chuyển dữ liệu; vì vậy, thiết lập pipeline gộp + refresh nhất quán thường an toàn hơn thao tác thủ công.

Video minh họa thao tác gộp file theo thư mục bằng Power Query.

Khi nào nên gộp bằng Copy–Paste hoặc Consolidate?

Có, bạn vẫn có thể gộp nhiều file Excel bằng copy–paste hoặc Consolidate nếu dữ liệu ít, chỉ làm một lần, và yêu cầu kiểm soát đơn giản; nhưng đổi lại rủi ro bỏ sót và sai lệch cao hơn khi khối lượng tăng.

Tiếp theo, bảng dưới đây giúp bạn chọn phương pháp theo tình huống, để tránh “dùng dao mổ trâu để giết gà” hoặc ngược lại.

Bảng này chứa tiêu chí chọn phương pháp gộp theo nhu cầu (tự động, sạch dữ liệu, ít lỗi) và khối lượng file.

Phương pháp Phù hợp khi Điểm mạnh Rủi ro
Power Query (From Folder) Gộp định kỳ, nhiều file, cần refresh Tự động, lưu bước xử lý, dễ mở rộng Cần chuẩn schema, học thao tác ban đầu
Copy–Paste Ít file, làm 1 lần, dữ liệu nhỏ Nhanh, không cần thiết lập Dễ dán lệch cột, bỏ sót file, khó audit
Consolidate Chỉ cần tổng hợp chỉ tiêu Nhanh ra tổng Không tạo “bảng master” để phân tích sâu

Quan trọng hơn, nghiên cứu về lỗi spreadsheet cho thấy lỗi là phổ biến và không nhỏ; vì vậy khi quy trình lặp lại, bạn nên chuyển sang cách gộp có thể kiểm soát và kiểm tra được (như pipeline).

Cách gộp nhiều file Excel bằng VBA/Macro khi cấu trúc cố định

Nếu bạn cần gộp nhanh trên máy nội bộ, cấu trúc file cố định (cùng sheet, cùng cột, cùng vùng dữ liệu), thì Macro/VBA là lựa chọn “tốc độ” để tự động mở file, copy vùng, và dán vào master. Tuy nhiên, cách này phụ thuộc nhiều vào việc file không đổi cấu trúc.

Tiếp theo, thay vì dán code dài, bạn có thể triển khai theo hướng “ít rủi ro” như sau:

Tạo template master và quy định vùng dữ liệu

Cụ thể, thống nhất dữ liệu luôn nằm trong một Table (Ctrl+T) tên cố định, ví dụ T_Data. Khi đó macro chỉ cần đọc Table theo tên, hạn chế sai vùng.

power query excel 365

Dùng Macro Recorder cho thao tác lặp đơn giản, rồi tinh chỉnh

Để bắt đầu, ghi macro cho 1 file mẫu: mở file → copy Table → dán vào master (Append). Sau đó mới lặp theo danh sách file trong thư mục. Bạn nên thêm bước kiểm tra “file đang mở” và “Table tồn tại” để tránh macro chạy sai.

excel power query

Thiết lập cơ chế audit: cột nguồn và thời gian gộp

Quan trọng hơn, hãy thêm 2 cột vào master: SourceFileImportedAt. Nhờ vậy, khi phát hiện lệch số, bạn truy ngược được file nào gây sai.

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, nhóm tác giả đo lỗi theo “lỗi trên 10.000 trường”, cho thấy kiểm tra nhất quán và đối chiếu giúp giảm lỗi; cơ chế audit trong file master đóng vai trò tương tự kiểm tra nhất quán.

ghep n file excel thanh nhieu file 0cd7106b

Gộp dữ liệu từ nhiều sheet trong một workbook

Nếu dữ liệu nằm trong một file nhưng rải ở nhiều sheet (VD: Tháng 1…Tháng 12), bạn có thể gộp theo 2 hướng: Power Query “From Workbook” để append nhiều sheet, hoặc chuẩn hóa thành 1 Table rồi phân tích bằng Pivot.

Tiếp theo, hãy chọn theo mục tiêu:

  • Cần bảng master chi tiết: append các sheet về 1 Table, thêm cột “Tháng/SheetName”.
  • Chỉ cần tổng: Consolidate/Pivot để ra chỉ tiêu theo tháng.

Mẹo: đưa dữ liệu về “Table chuẩn” trước khi gộp

Cụ thể, biến từng sheet thành Table sẽ giúp bạn không bị lệch vùng khi thêm dòng mới. Ngoài ra, tránh bố trí nhiều bảng lộn xộn trong một sheet vì dễ gây hiểu sai dữ liệu khi xử lý tự động.

Mẹo: thêm cột ngữ cảnh để không mất “nguồn” sau khi gộp

Ví dụ, thêm cột Period (tháng/quý) hoặc SheetName để khi lọc Pivot bạn không bị “một đống dữ liệu vô danh”. Đây là cách giữ ngữ cảnh mà vẫn gộp gọn.

excel power query

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, việc đối chiếu sai khác giữa các bộ dữ liệu được thực hiện bằng so sánh có hệ thống; thêm cột ngữ cảnh là nền tảng để bạn đối chiếu khi dữ liệu đã gộp.

Xử lý các tình huống khó: khác cột, trùng dữ liệu, lỗi định dạng

Khi gộp nhiều file Excel, các lỗi “đau đầu” thường không nằm ở thao tác gộp mà nằm ở độ không đồng nhất giữa file: thiếu cột, sai kiểu dữ liệu, tên sheet khác, hoặc dữ liệu trùng.

Tiếp theo, hãy xử theo từng nhóm lỗi để không “chữa cháy” lan man:

Khác cột/thiếu cột: ưu tiên chuẩn theo cột “bắt buộc”

Cụ thể, xác định nhóm cột bắt buộc (mã, ngày, số tiền…) và nhóm cột tùy chọn. Trong Power Query, bạn có thể chọn cột theo danh sách chuẩn, thiếu thì để null; sau đó kiểm tra file nào thiếu để yêu cầu bổ sung.

ghep n file excel thanh nhieu file 0cd7106b

Lỗi ngày tháng: chuẩn hóa locale và dùng transform nhất quán

Ví dụ, 01/02 có thể là 1 Feb hoặc 2 Jan tùy hệ. Cách an toàn là ép kiểu bằng “Using Locale” trong Power Query hoặc chuyển đổi theo định dạng ISO (YYYY-MM-DD) ở đầu pipeline.

excel power query

Trùng dữ liệu: xác định khóa trùng trước khi Remove Duplicates

Quan trọng hơn, đừng xóa trùng “cả dòng” nếu dữ liệu có thể khác ở cột phụ. Hãy tạo khóa như (Mã + Ngày + Số chứng từ) rồi xóa trùng theo khóa để không mất bản ghi hợp lệ.

File lỗi/khác sheet: tách luồng “error handling”

Để bắt đầu, bạn nên lọc file theo phần mở rộng, bỏ file tạm (~$), và trong Power Query tạo bước kiểm tra “sheet/table tồn tại”. Nếu file không đạt, đưa vào danh sách lỗi để xử thủ công thay vì làm hỏng toàn bộ pipeline.

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, sai số được phát hiện bằng so sánh và gắn nhãn lỗi theo nhóm; vì vậy, tách luồng xử lý lỗi (error handling) giúp bạn khoanh vùng và không làm lan lỗi sang dữ liệu tốt.

power query excel 365

Mở rộng: tự động hóa quy trình sau khi gộp để dùng lâu dài

Để dùng “bảng master” bền, bạn nên bổ sung lớp tự động hóa: refresh, kiểm tra, và chia sẻ đầu ra đúng mục đích.

Tự refresh và tối ưu hiệu năng file master

Cụ thể, bạn có thể thiết lập refresh trong Properties (Queries & Connections) để cập nhật khi mở file; đồng thời chỉ load các bảng cần thiết để giảm dung lượng. Trong thực hành, Power Query ghi lại từng bước biến đổi, giúp bạn tái sử dụng và cập nhật thay vì làm lại từ đầu.

excel power query

Chuẩn hóa đầu ra cho chia sẻ và lưu trữ

Ví dụ, sau khi gộp xong, bạn nên khóa cấu trúc cột, đặt tên bảng rõ ràng, và tách “Input/Output” để người khác không vô tình sửa pipeline. Nếu bạn làm việc nhóm, hãy thống nhất quy ước để giảm lỗi do “mỗi người một kiểu”.

power query excel 365

Liên quan thao tác văn phòng khác (không chỉ Excel)

Ngoài gộp dữ liệu, trong quy trình làm việc thực tế, bạn có thể cần gộp nhiều file Word thành 1 để nộp báo cáo, hoặc chuẩn hóa file tổng hợp trước khi gửi đi trong bộ phần mềm văn phòng quen thuộc; khi in báo cáo, nhiều người cũng hay tìm cách in Excel vừa trang A4 để tránh bị tràn cột. Những việc này thường đi kèm với thói quen dùng các phần mềm thông dụng trong doanh nghiệp, nên việc chuẩn hóa đầu ra ngay từ bước gộp sẽ tiết kiệm công về sau.

ghep n file excel thanh nhieu file 0cd7106b

Nguồn tải/cập nhật công cụ (chính thức)

Nếu bạn cần tài liệu chính thức về Power Query và tính năng combine files: https://support.microsoft.com (tìm “Import data from a folder with multiple files (Power Query)”) và https://learn.microsoft.com (tìm “Combine files overview”).

Theo nghiên cứu của University of South Florida từ Department of Epidemiology and Biostatistics, vào 05/2008, cách đo lỗi theo chuẩn “errors per 10,000 fields” nhấn mạnh giá trị của kiểm soát quy trình; vì vậy, tài liệu hóa và chuẩn hóa pipeline sau khi gộp là bước giúp bạn duy trì chất lượng dữ liệu lâu dài.

excel power query

FAQ (Các câu hỏi thường gặp)

Power Query có gộp được file khác số dòng không?

Có. Miễn là cùng schema (cùng tên cột/ý nghĩa), số dòng mỗi file có thể khác nhau; Power Query sẽ append thành một bảng dài.

Gộp xong rồi, thêm file mới có tự vào bảng không?

Nếu bạn gộp theo thư mục bằng Power Query, thêm file mới vào thư mục rồi Refresh là dữ liệu cập nhật; đây là ưu điểm lớn so với copy–paste.

File có tên sheet khác nhau thì xử lý sao?

Cách ổn nhất là chuẩn hóa tên sheet/table trong các file nguồn. Nếu không thể, hãy tạo bước điều kiện trong Power Query để chọn đúng sheet theo quy tắc (ví dụ sheet chứa tiêu đề chuẩn), và đưa file “không đạt” vào danh sách lỗi để xử riêng.

Nên chọn Power Query hay VBA?

Power Query mạnh khi bạn cần lặp lại + refresh + làm sạch. VBA phù hợp khi cấu trúc cố định, thao tác đơn giản, và bạn cần chạy nhanh theo kịch bản nội bộ; tuy nhiên vẫn nên thêm cột audit để truy nguồn khi có sai lệch.

Để lại một bình luận

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *