Skip to content

GoodRead

AngularGrad: A New Optimization Technique for Angular Convergence of Neural Networks

Abstract

Convolutional neural networks (CNNs) được đào tạo bằng cách sử dụng các trình stochastic gradient descent (SGD). Gần đây, adaptive moment estimation (Adam) được phổ biến nhờ khả năng giải quyết dying gradient problem của SGD. Tuy nhiên hầu hêt chúng đều chưa khai thác optimization curvature information hiệu quả. AngularGrad là một trong những tiên phong tìm kiếm cách khai thác gradient angular information apart from its magnitude. AngularGrad đề xuất tạo ra một điểm số để kiểm soát step size dựa trên gradient angular information của các lần lặp trước đó.

Introduction

Trong vòng một thập kỷ qua, các nỗ lực giảm bóng bán dẫn trong các chip đã tăng đáng kể khả năng tính toán của máy tính. Kể từ 2016, sự cải thiện hiệu năng của GPU đã làm tăng số lượng các mô hình deep learning1. Các mô hình DL được phát triển theo kịch bản mà trong đó, artificial neural networks (ANNs) bắt chước các nơ ron trong bộ não con người bằng cách học từ các sự kiện, kích thích mới, đồng thời dựa trên các node được tổ chức và kết nôi với nhau thông qua các trọng số ở mỗi lớp, trong cấu trúc phức tạp đa lớp có thứ bậc.

Tuy nhiên, việc huấn luyện các mô hình này gặp nhiều thách thức. Ngoài yêu cầu khả năng tính toán lớn, thì khi mô hình đi sâu nhiều lớp, lượng dữ liệu đòi hỏi để huấn luyện nó là vô cùng lớn và chúng có xu hướng làm mô hình overfitting.

Về mặt toán học, DNN có thể mô tả bằng một hàm mapping \(f( \cdot ,\theta)\) với việc hamp input \(x \in X\) với output \(y \in Y\) thông qua việc chỉnh sửa tham số \(\theta\) (weights and biases) hoặc hàm loss \(J(\theta)\) tối ưu hoặc giảm chi phí. Việc huấn luyện mô hình là việc xấp xỉ hàm \(f\) khi được cung cấp mạng nơ-ron với độ sâu và trọng số khác nhau. Mặc dù độ sâu của mô hình phụ thuộc vào nhiều yếu tố, thì thông qua việc lặp lại quá trình forward-backward \(J(\theta)\), mô hình sẽ tự động điều chỉnh các giá trị của trọng số để có giá trị tốt nhất.

Nhiều thuật toán được đưa ra nhằm tối ưu hóa với trade-off giữa tốc độ đào tạo và model generalization, Gradient descent là một trong số đó. Nó cung cấp nhiều thuật toán khác nhau, trong đó có stochastic gradient descent (SGD)2 và phiên bản momentum (SGDM)3. Hai phương pháp này khá phổ biến do tính đơn giản của nó mặc dù bị ảnh hưởng rất nhiều bởi phương sai trong tham số của model và vấn đề vanishing gradient. Để khắc phục những hạn chế này, các thuật toán cố gắng tạo ra learning rate, trong đó có Adam4. Tuy nhiên chúng chưa giải quyết được hiện tượng zig-zag, xuất hiện các bản cập nhật gây nhiễu trong quỹ đạo tối ưu hóa do thay sự thay đổi lớn của các gradients. Do đó, đường cong hội tụ thường có các biến động đột ngột, ảnh hưởng tới hiệu suất cuối cùng của huấn luyện.

Nhằm tăng tốc hội tụ và giảm hiện tượng zig-zac trong huấn luyện, bài báo giới thiệu AngularGrad5. Nó sử dụng direction/angle (hướng/góc) của vector gradient. Góc giữa hai lần lặp hướng gadient được sử dụng, do đó các thay đổi trong quỹ đạo được làm mịn đáng kể, hướng tới việc tối ưu hàm chi phí, từ đó giảm tài nguyên tính toán cần thiết để huấn luyện.

AngularGrad

Các thách thức của SGD có thể tóm lược vào 3 điểm:

  • Chọn được learning rate rất khó

  • Cùng một learning rate được trong một epoch được sử đụng để update toàn bộ parameter.

  • Nó dễ bị kẹt ở các cực tiểu cục bộ trong quá trình tối ưu hóa

Để khắc phục vấn đề thứ 3 một hệ số được đưa vào để tăng tốc SGD theo hướng liên quan và giảm dao động, đã tạo ra SGDM, với việc thêm một tham số \(\gamma\) trong vector cập nhật từ bước trước đó vào bước hiện tại. Tuy nhiên, cần có adaptive learning rate để giải quyết những vấn đề liên quan đến tốc độ học không đổi. Adam4 optimizer đã được phát triển để cải thiện. Nó lưu trữ giá trị trung bình giảm theo cấp số nhân \(m_t\) và giá trị trung bình giảm theo cấp số nhân bình phương \(v_t\) trong các gradients trước. Tuy nhiên, mặc dù khai thác được thông tin thay đổi của các gradients trong quá khứ để tinh chỉnh, nhưng nó không thể loại bỏ phương sai cao của gradients trong các bước trung gian. AngularGrad giới thiệu một tối ưu mới trong đó có tính đến góc giữa hai gradients liên tiếp trong quá trình tối ưu. Một hệ số góc mới được tính như sau

\[ \phi_t = \tanh ( |\sphericalangle (A_{min})|) \cdot \lambda_1 + \lambda_2, \]

với \({\lambda_1,\lambda_2} \in {0,1}\) là những hyperparameters. Theo kinh nghiệm, giá trị tốt nhất là \(\lambda_1 = \lambda_2 = \frac{1}{2}\). \(\sphericalangle\) biểu diễn \(\cos \measuredangle\) hoặc \(\tan \measuredangle\) trong khi \(\tanh(x)\) là một hàm phi tuyến tính nén tất cả các giá trị \(x\) giữa \(-1\)\(1\) theo công thức sau:

\[ \tanh(x) = \frac{exp^x - exp^{-x}}{exp^x + exp^{-x}} \]

\(A_t\) là góc giữa các bước gradients liên tiếp \(g_t\)\(g_{t-1}\). Tương tự, góc giữa các gradients bước \((t^-1)^{th}\) được tính toán và gọi là là \(A^{t-1}\). Vậy, \(A_{min} = min(A_{t-1}, A_t)\)

Graphical illustration
Minh họa đồ họa về thông tin gradient góc. Bộ tối ưu hóa được đề xuất làm mịn gradient path để tăng tốc độ hội tụ của nó bằng cách flattening góc giữa các gradient liên tiếp. AngularGrad optimizer flattens góc giữa hai vector (A) và chuyển nó thành A’ dẫn tới làm mịn đường curve

Hệ số góc \(\phi_t\) được sử dụng để điều chỉnh learning rate. AngularGrad không chỉ đảm bảo rằng các bản cập nhật tham số sẽ nhỏ hơn trong các vùng thay đổi độ dốc thấp và ngược lại, mà còn giảm độ biến thiên cao của các độ dốc vì nó giảm thiểu cosin hướng của hai độ dốc liên tiếp trong mỗi bước. Để làm được việc đó, nó tính toán hai moments \(m_t\)\(v_t\), hai moments hiệu chỉnh bias \(\widehat{m_t}\)\(\widehat{v_t}\). Việc cập nhật tham số được thực hiện theo công thức sau

\[ \theta_t = \theta_{t-1} - \frac{\alpha_t \cdot \phi_t}{\sqrt{\widehat{v_t}} + \epsilon } \widehat{m_t} \]

Chi tiết về AngularGrad được mô tả theo mã giả dưới đây

\[ \begin{align*} \mathbf{initialize:} \quad & \theta_0, m_0 \leftarrow 0, v_0 \leftarrow 0, t \leftarrow 0, \lambda_1 = \lambda_2 = \frac{1}{2}, \sphericalangle = \{\measuredangle \cos, \measuredangle \tan\} \\ \mathbf{while} \quad & \theta_t \text{ not converged } \mathbf{do} \\ & t \leftarrow t +1 \\ & g_t \leftarrow \nabla_{\theta} f_t(\theta_{t-1}) \\ & A_t \leftarrow \tan^{-1} | (g_t - g_{t-1}) / (1 + g_t \cdot g_{t-1})| \\ & A_{\min} \leftarrow \min(A_{t-1},A_t) \\ & \phi_t \leftarrow \tanh( |\sphericalangle (A_{min})|) \cdot \lambda_1 + \lambda_2 \\ & m_t \leftarrow \beta_1 \cdot m_{t-1} + (1 - \beta_1) \cdot g_t \\ & v_t \leftarrow \beta_2 \cdot v_{t-1} + (1 - \beta_2) \cdot g_t^2 \\ & \widehat{m_t} \leftarrow m_t / (1 - \beta_1^t) \\ & \widehat{v_t} \leftarrow v_t / (1 - \beta_2^t) \\ & \theta_t \leftarrow \theta_{t-1} - \alpha_t \cdot \phi_t \cdot \widehat{m_t} /(\sqrt{\widehat{v_t}} + \epsilon) \\ \mathbf{end while} \\ \mathbf{return} \quad \theta_t \end{align*} \]

Công thức trên đạt được 3 bổ đề:

  • Cần ít thời gian hơn để hội tụ nếu đường đi của đường cong mượt mà hơn thay vì ngoằn ngoèo.

  • Cần ít epochs hơn để đạt đến giá trị tối thiểu nếu đường cong mượt mà hơn thay vì ngoằn ngoèo

  • Hệ số góc làm cho các bản cập nhật không thay đổi theo những thay đổi độ cong đột ngột.

Để chứng minh cho công thức, mô hình hóa bài toán tối ưu hóa như một hồi quy trên ba hàm không lồi một chiều, thực hiện tối ưu hóa trên các hàm này bằng cách sử dụng SGDM, Adam, diffGrad, AdaBelief, \(AngularGrad^{\cos}\)\(AngularGrad^{\tan}\). Ba hàm không lồi được mô tả như sau:

\[ F1(x) = \left\{ \begin{array}{rl} (x+0.3)^2, & \text{for } x \leq 0 \\ (x-0.2)^2 + 0.05, & \text{for } x > 0 \end{array} \right. \]
\[ F2(x) = \left\{ \begin{array}{rl} -40x - 35.15, & \text{for } x \leq -0.9 \\ x^3 + x\sin(8x) + 0.85, & \text{for } x > -0.9 \end{array} \right. \]
\[ F3(x) = \left\{ \begin{array}{rl} x^2 & \text{for } x \leq -0.5 \\ 0.75 + x & \text{for } -0.5 < x \leq -0.4 \\ -7x/8 & \text{for } -0.4 < x \leq 0 \\ 7x/8 & \text{for } 0 < x \leq 0.4 \\ 0.75 - x & \text{for } 0.4 < x \leq 0.5 \\ x^2 & \text{for } 0.5 < x \\ \end{array} \right. \]

với \(x \in (-\infty, +\infty)\) là input.

Empirical results

Hình trên mô tả \(F1\), \(F2\)\(F3\) theo thứ tự từ trên xuống. Hàm \(F1\) có một giá trị cực tiểu cục bộ trong khi \(F2\)\(F3\) có hai. Chúng được setting như sau: decay rates của moments bậc nhất, bậc hai \((\beta_1, \beta_2)\) là 0.95 và 0.999; các moments \((m,v)\) được khởi tạo bằng 0; learning rate \(\alpha = 0.1\) và tham số \(\theta\) được khởi tạo bằng \(-1\). Khởi tạo gradient ở bước \(1^{st}, (g_0) = 0\). Chạy vòng lặp 300 lần, regression loss và \(\theta\) được ghi lại để phân tích. Cột đầu tiên mô tả function shapes, trong khi hai cột còn lại mô tả regression loss so với số iterations, số parameters với số iterations tương ứng.

Hình 2c cho thấy Adam và AdaBelief vượt qua giá trị trung bình \(\theta = -0.3\) và cuối cùng hội tụ tại \(\theta = 0.2\). Tuy vậy, chúng không tiến tới zero loss mà hội tụ ở 0.05, trong khi đối với SGDM, diffGrad, \(AngularGrad^{\cos}\)\(AngularGrad^{\tan}\) đều hội tụ \(loss=0\) (hình 2b). Nguyên nhân được đưa ra là do hiệu ứng zigzagging (nhiễu) của đường cong, hệ số góc \(\phi\) được giới thiệu để giảm nó và tiến tới mức tối thiểu toàn cục. Điều tương tự cũng thấy ở hình 2e và 2f, trong đó không chỉ Adam mà cả SGDM đều không thể hội tự tại loss = 0.

Cuối cùng, trong Hình 2h và 2i, chúng ta quan sát thấy rằng tất cả các trình tối ưu hóa đều hội tụ tại \(loss=0\) có thể tránh bị mắc kẹt trong cực tiểu cục bộ và đạt cực tiểu toàn cục. Tuy nhiên, dao động của \(AngularGrad^{\cos}\)\(AngularGrad^{\tan}\) nhỏ hơn gần mức tối thiểu toàn cục. Do đó, chúng đạt được sự hội tụ chính xác hơn. Tóm lại, phân tích thực nghiệm cho thấy rõ ràng rằng, trong số các hàm đã đề cập ở trên, \(AngularGrad^{\cos}\)\(AngularGrad^{\tan}\) không bị kẹt ở cực tiểu cục bộ và hội tụ đến cực tiểu toàn cục nhanh hơn nhiều khi so sánh với các trình tối ưu hóa cạnh tranh khác.


  1. Yann LeCun, Yoshua Bengio, and Geoffrey Hinton. Deep learning. nature, 521(7553):436–444, 2015. 

  2. Léon Bottou and others. Stochastic gradient learning in neural networks. Proceedings of Neuro-Nımes, 91(8):12, 1991. 

  3. Ning Qian. On the momentum term in gradient descent learning algorithms. Neural networks, 12(1):145–151, 1999. 

  4. Diederik P Kingma and Jimmy Ba. Adam: a method for stochastic optimization. arXiv preprint arXiv:1412.6980, 2014. 

  5. Swalpa Kumar Roy, Mercedes Eugenia Paoletti, Juan Mario Haut, Shiv Ram Dubey, Purbayan Kar, Antonio Plaza, and Bidyut B Chaudhuri. Angulargrad: a new optimization technique for angular convergence of convolutional neural networks. arXiv preprint arXiv:2105.10190, 2021. 

Thực hiện literature review bằng các công cụ

Bài viết này mình dịch từ một bài viết có tiêu đề tương tự được đăng trên Physics Lab để làm tài liệu tham khảo cho bản thân.

Cách đọc một bài báo khoa học

Giai đoạn một

Giai đoạn này chỉ mất một chút thời gian nhưng có vai trò rất quan trọng trong việc đọc các bài báo khoa học, nên bao gồm các bước sau:

  • Đọc nhanh tiêu đề, abtract và introduction.
  • Xem các hình ảnh và caption của chúng
  • Ghi lại các phần tiêu đề để có cái nhìn tổng quan về paper.
  • Đọc nhanh phần kết luận
  • Kiểm tra phần tài liệu tham khảo và note các tài liệu bạn đã đọc
  • Nên sử dụng ngôn ngữ là tiếng Anh (hoặc tiếng nước ngoài khác cùng ngôn ngữ với paper) để không tốn thời gian dịch hai lần.

Info

Note đầy đủ các thông tin trên vào một database (notion Literature Tracker), ghi tag đẩy đủ theo ý của bạn và tag của papaer (quan trọng)

Giai đoạn hai

Thực tế giai đoạn này mới là giai đoạn đọc thật sự của một bài báo. Giai đoạn này giúp ta hiểu rõ hơn bài báo và cách mà nó liên quan tới nghiên cứu của mình. Việc đọc tài liệu giấy hay kỹ thuật số là tùy sự lựa chọn, sao cho mắt không căng thẳng và thuận tiện nhất.

Đọc các tài liệu trong giai đoạn này cần highlight các điểm quan trọng, có thể chia theo màu:

  • Màu đỏ cho mục tiêu và kết quả bài báo
  • Màu cam cho các thuật ngữ và từ viết tắt
  • Màu vàng cho các nghiên cứu trước và background
  • Màu xanh cho các thông số và phương trình được sử dụng
  • Màu tím cho future work và implications
  • Màu lục cho tài liệu tham khảo cần xem

Sau đó, người đọc cần trả lời các câu hỏi/đưa ra nhận xét của mình về bài báo đó. Thường được note dưới dạng các dấu đầu dòng để dễ tìm lại

  • Research question/problem của bài báo là gì?

  • Bài báo có giá trị cho nghiên cứu của bản thân hay không? Nếu có thì tại sao?

  • Tác giả bài báo có cố gắng thuyết phục người đọc tin vào điều gì không? Nếu có thì tôi có bị thuyết phục không? Nếu không, tại sao tôi không bị thuyết phục?

  • Phần nào trong bài báo khiến tôi quan tâm? Tại sao?

  • Tại sao tác giả chọn cách tiếp cận hoặc khung lý thuyết này?

  • Người đọc có đồng ý với tác giả về các vấn đề đó không?

  • Tác giả nghĩ gì về ý nghĩa của những phát hiện đó?

  • Người đọc có đồng ý với tác giả về những ý nghĩa đó không?

  • Bài viết này đóng góp những gì, suy nghĩ gì, phương pháp gì cho nghiên cứu của người đọc?

Sau khi trả lời những câu hỏi trên, người đọc quyết định đây có phải là một bài báo cốt lõi của nghiên cứu liên quan hay không. Nếu có, thì chuyển nó sang phần thứ ba

Giai đoạn ba

Giai đoạn này, người đọc đảm bảo rằng bản thân hiểu được đẩy đủ những gì bài báo truyền tải cùng với các background của nó. Nhìn chung là thực hiện lại một bài báo như vậy. Người đọc cần: - Nếu là tác giả, bạn cần làm những gì để đạt được những kết quả trong bài báo - Tái hiện lại các thí nghiệm, kiểm tra kết quả và đối chiếu với kết quả của bài báo. - Xác định các điểm đổi mới mà tác giả đã thực hiện, những điểm nào còn hạn chế. - Các kỹ thuật trong bài báo đề cập có được thực hiện đúng, có vấn đề gì với các kỹ thuật đó, dữ liệu cho thí nghiệm chính xác và khách quan không.

Thao tác với các công cụ

Sau khi đã học đọc, cần có một phương pháp thực hiện hàng loạt và ghi lại những điều đã đọc. Mình đã sử dụng phương pháp theo sơ đồ dưới:

graph TD
  A[Literature Research] --> B[Add relevant paper to library & Literature Tracker];
  B --> C{Relevant to research?};
  C --> |Yes| D[First pass, scan and add tag];
  C --> |No| A;
  D --> E{worth reading more depth?};
  E --> |Yes| F[Second pass, complete literature notes and critical engagement question];
  E --> |No| A;
  F --> G[Buld systhesis matrix];
  G --> H[Write liteature review];
  H --> I[Update liteature review];
  I --> Z[Refine search question];
  Z --> A;
  F --> K{Is it core paper?};
  K --> |Yes| L[Third pass, reimplement the paper in own words];
  L --> I;
Library building and suggestions

Đây luôn là bước bắt đầu của mọi quá trình nghiên cứu. Trước hết, cần nhận diện một số keywords để bắt đầu quá trình search. Hãy trò chuyện với giáo sư để tìm các keywords phù hợp cho các nghiên cứu khác nhau. Một phương pháp khác là sử dụng chức năng tìm kiếm liên quan trên các công cụ search hoặc xem các trích dẫn từ bài báo gốc. Trong soó những các trích dẫn này, sẽ có một số trích dẫn được đề cập nhiều trong các bài báo, có thể đó chính là những bài báo quan trọng mà ta cần tìm kiếm

Info

Qua một thời gian, người đọc sẽ nhận ra một số bài báo thường xuyên được trích dẫn.

Mendeley là một công cụ hữu ích để lưu trữ và quản lý thư viện các bài báo. Nó có nhiều tính năng như chia sẻ thư mục với đồng nghiệp, có hỗ trợ phiên bản app trên nhiều nền tảng và brower extension.

Literature databases and keyword

Web of Science là một trong các công cụ hữu ích để nhận thông báo về các bài báo mới được ra mắt dựa trên các từ khóa bạn chọn. Nó cũng cung cấp một cơ sở dữ liệu các bài báo dựa trên các keyword nhập vào. Đây là bước khởi đầu tốt để hình thành định hướng nghiên cứu của bạn, bên cạnh những tư vấn của giảng viên hướng dẫn.

Google Scholar cũng là lựa chọn tốt trong nhiệm vụ này.

Literature mapping tools

Trong quá trình tìm hiểu và đọc các bài báo, cần hiểu rõ mối quan hệ giữa các bài báo này như thế nào. Citation GeckoConnected Papers là hai công cụ khá hữu ích, cung cấp giao diện flow-chart để hiểu tính tương quan giữa các bài báo.

Hai công cụ này cung cấp cái nhìn tổng quan từ một key paper tới các paper liên quan. Điều này giúp bạn hình dung được những bài báo quan trọng và chú ý tới/không bỏ lỡ nó. Nó giúp bạn tránh được tình huống nằm trong một chuỗi các bài báo phản bác lẫn nhau.

Sử dụng Connected Paper để chắc chắn rằng bạn không bỏ lỡ những bài báo quan trọng và hiểu rõ mối liên hệ giữa chúng. Nên sử dụng cả hai công cụ để hiểu rõ sự khác nhau giữa chúng.

The literature tracker

Trong phần này, một database trong Notion được sử dụng để ghi chép lại những ý tưởng, tổng hợp, nội dung quan trọng của một bài báo. Mặc dù có những tính năng tương tự như Mendeley nhưng Notion mạnh hơn ở khả năng tùy biến và filter những danh mục quan trọng.

The literature synthesis matrix

Khi một paper pass qua vòng thứ nhất, nó được chuyển qua lần đọc thứ hai với nhiều nội dung phải quan tâm hơn. Phần này note những câu hỏi mà ta cần trả lời trong Giai đoạn hai và ghi chú chúng vào trong Notion database.

Writing your literature review

Sau khi tổng hợp được một số core paper và đọc chúng ở giai đoạn ba, ghi chép chúng bằng lời văn của chính bạn (có thể sử dụng notion ở phần hai). Khi cảm thấy những gì tìm kiếm đã đủ, có thể bắt đầu viết literature review của chính bạn.

Xác định chủ đề nghiên cứu

Sử dụng literature matrix, nhìn nhận lại và xác định những câu hỏi nào là quan trọng mà muốn tập trung vào. Đối với từng phần trong chủ đề, xác định câu hỏi của bạn là gì, câu trả lời mong muốn là gì, bạn sẽ làm gì để đạt được nó.

Lựa chọn các bài báo liên quan đến chủ đề nghiên cứu

Sau khi có từng phần với các nội dung chính, lựa chọn các bài báo liên quan tới từng phần. Tổng hợp những điểm quan trọng của chúng. Số lượng không hẳn quan trọng trong phần này, quan trọng hơn nó là nguồn bạn lấy chúng, những tạp chí hoặc các nhà xuất bản uy tín. Cân nhắc số paper giới hạn cho mỗi section để tránh lan man (trừ trường hợp bài của bạn là bài review).

Giết con chim nhại

Chim nhại là một loài chim có khả năng bắt chước rất giống tiếng kêu của các loài khác. Chúng làm như vậy có lẽ để săn mồi hoặc lẩn trách kẻ thù. Chim nhại không bao giờ làm điều gì có hại, nó mang lại niềm vui bằng tiếng hót của chúng: "nó chẳng làm điều gì khác ngoài việc hót cho chúng ta nghe từ tận đáy tim của nó". Vì vậy giết con chim nhại là một tội ác. Giết một người da đen không có tội cũng là một tội ác, một tội ác ghê tởm nhất.

Chuyện kể theo góc nhìn tuổi thơ của Jean Louse Finch, hay tên ở nhà là Scout. Nhà cô tại một thị trấn lâu đời thuộc bang Alabama, một bang miền Nam nước Mỹ. Hơn nửa đầu là những câu chuyện vui chơi, phá làng phá xóm, nói xấu người này người kia, câu chuyện kì thị trong trường tiểu học, câu chuyện cách dạy học của cô giáo viên, và hơn cả ta cách dạy con của bố Atticus. Một người cha đơn thân không giàu có gì, nhưng dạy hai đứa con của mình rất tốt. Đến nỗi tôi ước gì sau này tôi có thể dạy con tôi như vậy. Nhà ông có một người giúp việc da đen. Ông coi người này như người thân của mình và bản thân cô cũng coi mình như vậy. Cô được quyền quát mắng và thậm chí đánh đòn cô, cậu chủ.

Atticus là một luật sư. Một ngày đẹp trời ông được phân công biện hộ cho Tom Robinson, một người đàn ông da đen bị buộc tội cưỡng hiếp (kết quả bất thành). Vào những năm 30 của thế kỷ trước - sau ít năm đại suy thoái bắt đầu - thì hiếp dâm là tử tội, nhất là một người da đen hiếp dâm phụ nữ da trắng. Atticus đà dành hết thời gian và sức lực của mình, bỏ qua những điều tiếng rằng tại sao ông luật sư da trắng lại biện hộ cho một người da đen, bỏ qua những dè bỉu của cộng đồng mà gia đình ông phải chịu, ông cũng bỏ qua việc ông được phân công biện hộ, hầu hết mọi người nghĩ ông chọn điều đó. Phiên tòa kết thúc, mọi người đều thấy cô gái nguyên đơn và cha cô ta nói dối. Án tử được quyết định sau khi bồi thẩm đoàn "họp lâu nhất từ trước tới giờ cho những trường hợp như vậy". Bồi thẩm đoàn đã cân nhắc công sức mà Atticus bỏ ra, chứ không hề cân nhắc Tom có tội hay không. Anh đã được định tội từ lúc bước vào phiên tòa, hay trước đó từ lúc anh sinh ra vậy. Như Tom đã nói, nếu ông đen thui như tôi thì ông cũng sợ mà bỏ chạy khỏi hiện trường thôi.

Tom chết! Anh bị bắn "nhiều hơn mức cần thiết" khi vượt ngục, trước phiên tòa phúc thẩm. Bob Ewell, cha cô gái nguyên đơn, âm mưu trả thù vì bị sỉ nhục rằng ông đã nói dối trên tòa, cuối cùng chết bởi con dao của mình trong lúc hành hung hai đứa trẻ. Cái chết của Bob không được điều tra và khám phá nhiều. Cảnh sát và người dân để ông ta chết như vậy.

Nhiều lúc sống trong hiện tại, ta quên mất rằng chỉ chưa đầy một trăm năm nước đây thôi, tại Mỹ, phụ nữ không được tham gia vào bồi thẩm đoàn và không được bỏ phiếu. Người da đen vẫn chết bởi chính phiên tòa công bằng do tội mà họ không làm. “Bên công tố đã không đưa ra được chút chứng cớ ý học nào có thể cho thấy rằng tội lỗi mà Tom Robinson bị cáo buộc đã từng xảy ra. Thay vào đó nó dựa vào lời khai của hai nhân chứng với chứng cứ không chỉ hết sức đáng nghi ngờ qua chất vấn, mà nó còn hoàn toàn mâu thuẫn với bị cáo. Bị cáo không có tội, nhưng ai đó trong phòng xử án này thì có.” Xã hội ngày nay đã khác, tốt đẹp và tiến bộ hơn. Nhưng phân biệt nam, nữ, chủng tộc, tôn giáo, giàu nghèo, giới tính, xu hướng vẫn còn đó. Chúng ta không bình đẳng theo cái nghĩa mọi người vẫn muốn hiểu "rằng một số người thì thông minh hơn một số người khác, một số người có cơ hội hơn bởi vì họ sinh ra với nó, một số đàn ông kiếm ra nhiều tiền hơn những người đàn ông khác – một số người sinh ra có tài năng vượt quá mức bình thường của hầu hết con người". Một số người sinh ra với những khác biệt và chúng ta không được phép, trong bất cứ tình huống nào, nhân danh bất cứ ai tuyên bố rằng họ có vấn đề về chính họ.

IKIGAI - Chất nhật trong từng khoảnh khắc

Cuốn sách mình mua trong một dịp tình cờ, đi vào nhà sách, lướt qua tay hàng chục cuốn và dừng lại, mở ra đọc lời giới thiệu và có đôi chút thích thú. Sách ngắn, khổ A5 chỉ chưa đầy 100 trang, đọc hết ngay được một lần và quả thực mình đã làm vậy, trước khi mang nó đi tặng. Vì suy cho cùng, mục đích cuốn sách mình mua về là vì vậy.

Sách in giấy dày, bìa dẹp, phông chữ rõ ràng, thuận mắt. Giá hơi mắc so với thời lượng của quyển sách, 74k.

Cuốn sách do một nhà báo tự do của BBC, người Mỹ gốc Nhật viết về chính thứ văn hóa của quê hương mình. Vì thời lượng ít ỏi, sự giới thiệu về tác giả nhìn chung sơ sài, bù lại sách kể theo ngôi thứ nhất, trong đó lồng ghép một số thông tin về người viết.

Tác giả giải thích IKIGAI là gì trong văn hóa Nhật. Rằng nó không phải là một mục tiêu, lý tưởng của cuộc đời. Mà đơn giản là điều hạnh phúc trong cuộc sống thường ngày, là công việc, sở thích, đam mê, nói như tác giả đề cập là “điều khiến ta thức dậy mỗi sáng”. Tác giả nói về sự lầm tưởng vùng giao của 4 vòng tròn huyền thoại thể hiện 4 khía cạnh trong công việc, rằng đó chính là ikigai. Ikigai không lớn lao, cũng không phiến diện như nhiều người lầm tưởng.

Tác giả cũng tổng kết và đưa ra vài định nghĩa, đặc điểm chung của ikigai. Rằng cho dù ikigai của mỗi người là khác nhau, là những cái riêng trong xã hội này, thì suy cho cùng, nó không thoát khỏi cái chung, thông qua những cái riêng đó mà biểu hiện mình. Ikigai của họ nghiêng về một bên trong một vài phạm trù: cuộc sống thường nhật > cuộc đời; cho đi > nhận lại; thay đổi > cố định; tình cảm > lý trí; cụ thể > trừu tượng; chủ động > thụ động.

Cuối cuốn sách, tác giả phỏng vấn một số nhân vật thực tế. Tại đây họ đưa ra nhiều khoảnh khắc ikigai của họ, rằng nếu ta không thể tìm thấy nó, thì thôi không nên chủ động tìm kiếm. Ta cứ hãy cứ sống trọn từng phút giây và một ngày nào đó, một khoảnh khắc tuyệt vời nào đó trong cuộc sống sẽ làm ta nhận ra, cái gì thực sự là ikigai của mình.

Và rồi, cuối cuốn sách, nếu bạn chưa thực sự tìm được ikigai của mình, tác giả đưa ra một vài câu hỏi để bạn tự hỏi mình. Và biết đâu đó, bạn sẽ tìm ra ikigai của mình.

Với thời lượng ngắn chỉ khoảng 30 phút độc, nội dung cuốn sách truyền đạt khá trọn vẹn và có ý nghĩa. Ngoài giá sách đắt, mình cho rằng có một nhược điểm nữa. Cuốn sách đưa ra nhiều số liệu khảo sát, nghiên cứu, bài giảng, bài nói chuyện của nhiều vị giáo sư, học giả, nhưng lại không có một ghi chú cụ thể nào về nguồn, phương pháp tìm kiếm những tư liệu này để độc giả tham khảo và tra cứu.

Muôn kiếp nhân sinh

Tác giả

Tác giả tên thật là Vũ Văn Du, du học ở Mỹ từ năm 1968. Ông có sự nghiệp làm việc và công tác khoa học ở nhiều trường đại học về công nghệ thông tin

Ông cũng là tác giả cuốn Hành trình về phương đông. Trang giới thiệu tác giả trong sách cũng giới thiệu đôi nét về ông. Tuy nhiên lại không có một phần kể về lịch sử của tác giả. Điểm này mình cho rằng là một thiếu sót của nhà xuất bản, vì nội dung các chủ đề ông viết khá đặc biệt, về những chuyện tâm linh khác thường mà theo mình thấy là phóng tác dựa trên những trải nghiệm của ông về mặt tinh thần. Việc giới thiệu bối cảnh của tác giả sẽ cho người đọc mạch suy nghĩ đồng điệu với tác giả, dễ dàng tiếp thu hơn.

Nội dung

Phần đầu, tác giả nói về nhân duyên viết nên cuốn sách. Nội dung cuốn sách viết theo lối đối thoại giữa các nhân vật, mà nhân vật chính trong câu chuyện này là một người bạn của tác giả. Ở đây tác giả sau khi nghe câu chuyện, cảm tác và thuật lại theo lời văn của ông.

Phần hai, nhân vật chính trải nghiệm và hồi tưởng về ký ức của bản thân ở một nơi gọi là Atlantis, một vùng gồm 3 quốc gia cổ xưa, có những tiến bộ khoa học vượt bậc nhưng ý thức đạo đức xã hội vẫn theo lối bầy đàn.

Nhân vật chính là một y sĩ xuất sắc, với một công cụ chữa bệnh có sức mạnh siêu phàm, có thể phân giải tế bào trong cơ thế người đến mức nguyên tử. Quốc gia của ông (Arya) nhỏ nhất trong 3 quốc gia, theo một tôn giáo tương tự thờ thần mặt trời. Hai quốc gia kia đấu đá với nhau và, nếu quốc gia nào thắng thì đất nước của ông sẽ trở thành nạn nhân tiếp theo. Ông này đã vi phạm điều cấm, học một thứ tà thuật của nước bên cạnh. Phát sinh dục vọng với một thánh nữ đồng trinh của tôn giáo mình.

Một ngày nọ, theo tính toán sâu xa, một loại tai nạn thiên nhiên khổng lồ, giống như trận lũ lụt Noah sẽ tới. Đất nước Arya của ông chọn ra một số người để đi lánh nạn, bao gồm nhiều thành phần của xã hội. Trong đó có vị thánh nữ Kris, nhưng không có ông. Vì ông này đã phạm điều cấm là học tà đạo. Vì dục vọng, ông này đã nghĩ cách và chiếm lấy cô gái kia, kết quả Arya bị xâm chiếm và giết chóc, trận đại hồng thủy nổi nên như dự báo. Tới đây kết thúc phần hai.

Phần ba, tác giả dựa vào các lý thuyết tôn giáo phương đông, bao gồm đạo Phật, Ấn độ giáo... và phương pháp Karma yoga để diễn giải nguồn gốc con người, sự vận động trong đời sống con người với mục tiêu hướng thiện. Luật Nhân quả và Luân hồi diễn ra trong vũ trụ, với quan điểm rõ ràng rằng ai làm gì đều có một hệ quả tương ứng. Tác giả cũng vận dụng một số lý thuyết khoa học thực hành để nói thêm và khẳng định góc nhìn của mình.

Phần bốn, nhân vật chính thông qua chiếc nhẫn được làm giống của Pharaoh mà nhớ về tiền kiếp.

Tại đây, ông là một hoàng tử bị lưu đày, nhờ được lực lượng giáo sĩ tín nhiệm, giúp đỡ, thành công đoạt được ngôi báu. Sau khi lên ngôi, ông đã ban hành nhiều luật lệ khắt khe, nâng cao sưu thuế, xây dựng nhiều điện thờ, đền đài để trả công giáo sĩ. Trong một lần vi hành, ông gặp một người y sĩ nghèo, than phiền về quyền lợi của giai cấp lãnh đạo và tầng lớp giáo sĩ, khiến dân nghèo nàn, chết nhiều vì xây lăng tẩm quá nhiều. Tại đây ông được nghe về phương pháp trị bệnh bằng tình yêu thương, một thứ mà ông thiếu thốn từ nhỏ bởi xuất thân của mình. Người y sĩ nghèo cùng cháu gái, hôn phu của cô ấy phàn nàn về việc Pharaoh đã tiêu tốn quá nhiều tài lực và cạn kiệt sức dân để xây nên điện thờ, lăng mộ cho ông và cả giới giáo sĩ nữa.

Nhân vật chính cũng bộc lộ một số suy nghĩ tiến bộ, về phương pháp thờ cúng thần thái dương suy cho cùng là vì lọi ích nhóm của giới giáo sĩ, thần thành thực sự nằm trong bản thân chứ không nằm trong buổi lễ cầu nguyện hay điện thờ.

Phần này tôi thấy cần phải nhận định rõ, nếu trải nghiệm về tiền kiếm này là có thật, thì những suy nghĩ được kể thông qua lời nói đó là của kiếp hiện tại, với những ý thức và năng lực của người hiện đại nhìn về quãng dài tiền kiếp ở quá khứ, chứ không phải đứng trên vị trí của một Pharaoh thời cổ đại khi tiếp xúc với dân chúng. Bởi lẽ, triết học và tôn giáo thời cổ đại, không thể xây dựng nên một con người có quyền lực tối cao về thần quyền và pháp quyền, lại có lòng cảm thông với sự thống khổ của dân chúng nghèo đói được. Nhất là tại Ai Cập cổ đại. Trải nghiệm vi hành này suy cho cùng, khó có thể diễn ra, mà nếu có thể diễn ra, cũng không thể nào thân thiện và có tình huống, một vị Pharaoh bị chính người dân của mình than phiền mà có thể bỏ qua, bình tĩnh như vậy được.

Phần năm, tác giả trải nghiệm tiếp tục làm Pharaoh của ông. Tại đây nhắc lại nhiều lần cái ý thức thần thành chính là tình yêu thương trong bản thể con người. Pharaoh này cũng bắt đầu chiến dịch thanh trừng nạn buôn thần bán thánh, lợi dụng tôn giáo làm lợi cho mình của giới giáo sĩ. Tuy nhiên, như đã nói ở phần trước, ông thất bại và cuối cùng không để lại thành tựu gì.

Điểm đáng chú ý ở phần này là đặt ra vấn đề các kim tự tháp không phải là lăng mộ mà là các đền thờ. Tác giả đưa ra nhiều dẫn chứng về cách xây dựng kim tự tháp trong thời kỳ cổ đại, cho đến bài trí cũng như hình vẽ trong kim tự tháp không giống với thông lệ an táng tại Ai Cập cổ đại, nhất là không tồn tại “Tử thư”. Tác giả cũng viện dẫn một số kim tự tháp có lối kiến trúc tương tự ở châu Mỹ, nhận định rằng những công trình kiến trúc này cùng mục đích là hoạt động tâm linh, tôn giáo. Đây là điểm cung bắt nguồn từ chủng tộc Atlatis cổ đại, khi tránh đại hồng thủy đã mang tới các vùng lãnh thổ khác nhau và truyền lại. Tác giả cũng viện dẫn trình độ kỹ thuật của Atlantis chính là yếu tố giúp xây dựng các kim tự tháp.

Phần sáu tác giả không đưa ra một hồi tưởng cụ thể gì, chủ yếu đặt nghi vấn về lịch sử các nền văn minh đã xuất hiện.

Các nhà khoa học phương Tây cho rằng, nền văn minh cổ nhất xuât phát từ vùng Ai Cập, La Mã, thông qua các công trình mà người dân còn để lại. Tuy nhiên tác giả nhận định, không phải nền văn minh nào cũng chú trọng việc xây cất công trình tôn giáo mà có thể họ phát triển mặt tinh thần, tôn giáo. Có nghĩa là, có thể ở Ấn độ và Trung Hoa cổ đại có những nền văn minh xưa hơn, có những thành tựu vượt bậc về mặt tinh thần. Tác giả cũng kể một số viện dẫn mà khoa học hiện đại chưa chứng minh được, đặt ra đó chính là điểm nghi vấn cốt lỗi, là lỗ hổng về lịch sử văn minh thế giới trong tiến trình phát triển của loài người.

Tác giả cũng nói sơ qua về quá trình phát triển tôn giáo, rằng các giáo sĩ đã tự tha hóa, không chuyên tâm tu tập. Từ đó, những pháp môn mật truyền không còn lưu lại, thay vào đó là các loại tà thuật, bùa chú, đa thần với mục đích dọa nạt, điều khiển nhân tâm con người.

Chương này hoàn toàn là các giả thuyết, không có gì rõ ràng, chỉ đơn giản nhắc lại các điều nghi vấn trong khoa học khảo cổ, lịch sử và viện vào đó để chỉ ra điều tác giả muốn nói.

Phần bày, tác giả tiếp tục nói về quy luật nhân quả, luân hồi, nghiệp báo của cá nhân và của cả cộng đồng, quốc gia. Tác giả đưa ra chu trình mới về cuộc đời luân hồi của con người, các quốc gia, nền văn mình, thậm chí là các hành tinh, hệ vũ trụ. Theo đó, mỗi đối tượng đều trải qua 4 quá trình thành lập, xây dựng, suy yếu và diệt vong. Dẫn chứng lại các quốc gia thần thoại như Atlantis, cổ đại như Ai cập đến cận - hiện đại như Tây Ban Nha.

Việc khẳng định các cá thể con người, toàn thể nhân loại bao gồm các nền văn minh diễn tiến theo các chu kỳ lên xuống mà không phải theo sơ đồ tịnh tiến, giống như thuyết tiến hóa của Đác Uyn. Đưa ra lý thuyết cho rằng, các sự vật, sự việc phát triển lúc lên, lúc xuống, thăng trầm theo các chu kỳ khác nhau, thời gian các chu kỳ, một phần của chu kỳ phụ thuộc vào nghiệp quả của con người, quốc gia đó. Tác giả cũng cho rằng, sự phát triển mạnh mẽ của khoa học kỹ thuật hiện đại chưa hẳn là bước tiến của nhân loại, mà đang đi đến những bước trong quá trình Hoại. Rằng con người đang phụ thuộc vào smart phone, các loại dịch bệnh diễn ra với những tác hại không thể lường. Điều này được củng cố trong đại dịch Covid-19 vừa qua.

Phần đầu của chương tác giả cũng đề cập đến phương pháp thiền định, chỉ một chút. Nội dung cơ bản về các quá trình tập luyện môn yoga, lưu ý giai đoạn đầu tập luyện thì chịu đau đớn hay suy nghĩ viễn vông là bình thường, cần phải kiên trì mới thành công.

Một vài đoạn trích

  • Cậu có biết tại sao như thế không? Tại vì mỗi đứa chạy điều hành động tùy theo lối cư xử của cha mẹ hay xã hội dành cho chúng. Tùy theo việc đứa trẻ được cha mẹ dạy dỗ như thế nào, được yêu thương hay bị đánh đập mà cuộc đời đối với nó trở nên đáng ghét hay đáng sống. Khi mới được sinh ra, đứa trẻ nào cũng có khả năng yêu thương vì nó được sinh ra qua tình yêu thương của cha mẹ. Nếu nó được sống trong yêu thương, nó sẽ biết thương yêu. Trái lại, nếu không được thế thì khả năng thương yêu của nó sẽ mất đi vào đó chị biết sống một cách vô ý thức. Làm sao nó có thể tương lai được nếu như trước giờ nó chưa hề được ai thương? Làm sao nó có thể yêu ai được khi nó không hề được ai yêu? Làm sao nó có thể thông cảm với nỗi đau của người khác khi khả năng yêu thương đồng cảm của nó đã bị thui chột? Do đó, mối quan hệ giữa nó và những người chung quanh sẽ trở nên hời hợt, và bị giới hạn trong những điều rất nhỏ, không thể vươn tầm mắt ra xa hay bay bổng lên cao được. Đầu óc của những đứa trẻ này sẽ chị dễ dàng trong những mối lợi nhỏ nhen, những thú vui vật chất tầm thường, những tham lam ích kỷ chứ không thể nào làm việc lớn được.

  • Các chiến thuyền của họ đi đến đâu thì gieo rắc kinh hoàng và dịch bệnh đến đó. Hầu hết những người da đỏ ở châu Mỹ, khoảng 2/3 dân số, đều chết vì những dịch bệnh do người Tây ban Nha mang vào. Như thế nên Tây Ban Nha mới chinh phục được Châu Mỹ một cách dễ dàng. Họ thẳng tay tiêu diệt các nền văn minh cổ, thay đổi phong tục tập quán, ngôn ngữ, tôn giáo và đặt nền móng cai trị hết sức tàn bạo cho những thuộc địa của họ. Thế mà ngày nay nhiều sách lịch sử vẫn còn ca ngợi tinh thần khai phá, chinh phục và đồng hóa những dân tộc “man rợ, thiếu văn minh” này của Tây Ban Nha. Đã đến lúc chúng ta cần nhìn lại những gì người Tây ban Nha đã làm được trong những thế kỷ trước và từ hạt nhân loại đã học được điều gì?

Nhận xét chung

Nhìn chung, cuốn sách cũng có những điểm mới đáng thú vị, việc đọc nó giống như luyện tập môn yoga, phải xem có phù hợp hay không. Có thể với trải nghiệm hiện tại của mình, cuốn sách này không phù hợp. Cuốn Hành trình về phương đông cũ của ông mình cũng thấy không phù hợp. Theo mình tìm hiểu, phần hai nội dung cũng không mới, chủ yếu vẫn kể lại, dùng lối dẫn chứng cũ để chứng minh. Bản thân mình thấy không phù hợp nên không có tiếp tục.

Nói về ưu điểm:

  • Tính mới, ưu điểm lớn nhất của cuốn sách này là tính mới. Bằng lối viết phóng tác theo những tưởng tượng, tác giả kể lại câu chuyện huyền bí, thần kỳ nhưng rất đỗi chân thật, mang đậm màu sắc tôn giáo phương đông. Tác giả cũng chỉ ra những nét đặc sắc vốn có của văn hóa, tôn giáo phương đông.

  • Tuy không phải sách self help, nhưng đây cũng xem như là một cuốn sách giúp người đọc có cách nhìn mới mẻ hơn, dịu dàng hơn với con người và tạo hóa xung quanh. Thông qua luật nhân quả, luân hồi là những điểm chính trong phật giáo, tác giả nói rằng, mọi lỗi lầm hay tai nạn của bản thân đều là nghiệp quả, cộng nghiệp trong quá khứ

Bên cạnh đó, cũng có những khuyết điểm, đó là:

  • Như đã đề cập ở trên, nhược điểm đầu tiên không thuộc về tác giả mà thuộc về nhà xuất bản. Muôn kiếp nhân sinh là một tập sách có nhiều cuốn. Vì vậy, tại cuốn đầu tiên cần giới thiệu rõ về tác giả, nhất là với lối viết phóng tác của tác giả. Nếu không có một cái nhìn tổng quan về cuộc đời, sự nghiệp của tác giả, người đọc khó lòng cảm khái được những điều mà tác giả cảm thấy.

  • Thứ hai, bố cục cuốn sách theo các chương thiên về các miền ký ức, theo dòng thời gian. Nhưng trong mỗi phần đều có những nội dung trùng nhau, không trọng tâm. Ví dụ như ở chương cuối nói về quy luật thành - trụ - hoại - diệt, tác giả lại không hề đi sâu vào quy luật này mà lại có một đoạn đầu nói về yoga. Tư tưởng luân hồi, nhân quả xuyên suốt nhưng không có nội dung mới, khá trùng lắp

  • Thứ ba, tác giả phê phán khoa học thực nghiệm. Cho rằng khoa học hiện đại chỉ đề cập đến các vấn đề mà có thể chứng minh được, có thể thấy được, cụ thể hóa thành công thức hay phương trình mà không đề cập đến phần tâm linh, bản chất sâu trong tâm hồn, linh hồn con người. Không giống như khoa học thực nghiệm, khi điều kiện giống nhau tuyệt đối thì các chất điểm là đối tượng nghiên cứu đều trải qua quá trình như nhau, tác giả cho rằng dù cho môi trường giống nhau thì mỗi một con người với linh hồn khác nhau sẽ cho ra trải nghiệm khác nhau. Điều này chắc chắn là không thể tái hiện. Nhưng tác giả dẫn chứng vô vàn các ví dụ, sự kiện lịch sử, phương trình khoa học, các câu nói trong sách của Plato để củng cố cho điều mình nói. Như vậy lại là dùng chính thực nghiệm để chứng minh ngược lại lý thuyết. Điều này mình nhận xét chủ quan là mang tính ngụy biện.