minor update

2025-04-24 05:47:35 -04:00 · 2021-05-06 08:55:46 -07:00 · 2021-05-06 08:55:46 -07:00 · 3e88a71801
commit 3e88a71801
parent 6107bf8247
6 changed files with 560 additions and 510 deletions
--- a/driver/tests/stress/kernel.bin
+++ b/driver/tests/stress/kernel.bin
--- a/driver/tests/stress/kernel.c
+++ b/driver/tests/stress/kernel.c
@ -7,17 +7,17 @@ void kernel_body(int task_id, void* arg) {
 	struct kernel_arg_t* _arg = (struct kernel_arg_t*)(arg);	
 	uint32_t stride    = _arg->stride;
 	uint32_t* addr_ptr = (uint32_t*)_arg->addr_ptr;
-	int32_t* src_ptr   = (int32_t*)_arg->src_ptr;	
-	int32_t* dst_ptr   = (int32_t*)_arg->dst_ptr;
+	float* src_ptr     = (float*)_arg->src_ptr;	
+	float* dst_ptr     = (float*)_arg->dst_ptr;
 	
 	uint32_t offset = task_id * stride;

 	for (uint32_t i = 0; i < stride; ++i) {
-		int value = 0;
+		float value = 0.0f;
 		for (uint32_t j = 0; j < NUM_LOADS; ++j) {
 			uint32_t addr  = offset + i + j;
 			uint32_t index = addr_ptr[addr];
-			value += src_ptr[index];
+			value *= src_ptr[index];
 		}
 		dst_ptr[offset+i] = value;
 	}
--- a/driver/tests/stress/kernel.dump
+++ b/driver/tests/stress/kernel.dump
--- a/driver/tests/stress/kernel.elf
+++ b/driver/tests/stress/kernel.elf
--- a/driver/tests/stress/main.cpp
+++ b/driver/tests/stress/main.cpp
@ -4,6 +4,8 @@
 #include <vortex.h>
 #include "common.h"
 #include <assert.h>
+#include <limits>
+#include <math.h>
 #include <vector>

 #define RT_CHECK(_expr)                                         \
@ -18,10 +20,55 @@

 ///////////////////////////////////////////////////////////////////////////////

+union Float_t {    
+    float f;
+    int   i;
+    struct {
+        uint32_t man  : 23;
+        uint32_t exp  : 8;
+        uint32_t sign : 1;
+    } parts;
+};
+
+inline float fround(float x, int32_t precision = 8) {
+  auto power_of_10 = std::pow(10, precision);
+  return std::round(x * power_of_10) / power_of_10;
+}
+
+inline bool almost_equal_eps(float a, float b, int ulp = 128) {
+  auto eps = std::numeric_limits<float>::epsilon() * (std::max(fabs(a), fabs(b)) * ulp);
+  auto d = fabs(a - b);
+  if (d > eps) {
+    std::cout << "*** almost_equal_eps: d=" << d << ", eps=" << eps << std::endl;
+    return false;
+  }
+  return true;
+}
+
+inline bool almost_equal_ulp(float a, float b, int32_t ulp = 6) {
+  Float_t fa{a}, fb{b};
+  auto d = std::abs(fa.i - fb.i);
+  if (d > ulp) {
+    std::cout << "*** almost_equal_ulp: a=" << a << ", b=" << b << ", ulp=" << d << ", ia=" << std::hex << fa.i << ", ib=" << fb.i << std::endl;
+    return false;
+  }
+  return true;
+}
+
+inline bool almost_equal(float a, float b) {
+  if (a == b)
+    return true;
+  /*if (almost_equal_eps(a, b))
+    return true;*/
+  return almost_equal_ulp(a, b);
+}
+
+///////////////////////////////////////////////////////////////////////////////
+
 const char* kernel_file = "kernel.bin";
 uint32_t count = 0;

-std::vector<int> test_data;
+std::vector<float> test_data;
 std::vector<uint32_t> addr_table;

 vx_device_h device = nullptr;
@ -68,7 +115,8 @@ void gen_input_data(uint32_t num_points) {
  addr_table.resize(num_points + NUM_LOADS - 1);

  for (uint32_t i = 0; i < test_data.size(); ++i) {
-    test_data[i] = std::rand();
+    float r = static_cast<float>(std::rand()) / RAND_MAX;
+    test_data[i] = r;
  }

  for (uint32_t i = 0; i < addr_table.size(); ++i) {
@ -98,21 +146,21 @@ int run_test(const kernel_arg_t& kernel_arg,
  std::cout << "verify result" << std::endl;  
  {
    int errors = 0;
-    auto buf_ptr = (int32_t*)vx_host_ptr(staging_buf);
+    auto buf_ptr = (float*)vx_host_ptr(staging_buf);
    
    for (uint32_t i = 0; i < num_points; ++i) {

-      int ref = 0;
+      float ref = 0.0f;
      for (uint32_t j = 0; j < NUM_LOADS; ++j) {
        uint32_t addr = i + j;
        uint32_t index = addr_table.at(addr);
-        int value = test_data.at(index);
-        //printf("*** [%d] addr=%d, index=%d, value=%d\n", i, addr, index, value);
-        ref += value;
+        float value = test_data.at(index);
+        //printf("*** [%d] addr=%d, index=%d, value=%f\n", i, addr, index, value);
+        ref *= value;
      }
      
-      int cur = buf_ptr[i];
-      if (cur != ref) {
+      float cur = buf_ptr[i];
+      if (!almost_equal(cur, ref)) {
        std::cout << "error at result #" << std::dec << i
                  << ": actual " << cur << ", expected " << ref << std::endl;
        ++errors;
--- a/hw/rtl/afu/VX_avs_wrapper.v
+++ b/hw/rtl/afu/VX_avs_wrapper.v
@ -52,7 +52,7 @@ module VX_avs_wrapper #(
    wire [NUM_BANKS-1:0][RD_QUEUE_ADDR_WIDTH-1:0] req_queue_size;
    wire [NUM_BANKS-1:0][REQ_TAG_WIDTH-1:0] avs_reqq_data_out;
    
-    wire [BANK_ADDRW-1:0] req_bank_sel = (NUM_BANKS >= 2) ? mem_req_addr [BANK_ADDRW-1:0] : 1'b0;
+    wire [BANK_ADDRW-1:0] req_bank_sel = (NUM_BANKS >= 2) ? mem_req_addr [BANK_ADDRW-1:0] : '0;

    wire avs_reqq_push = mem_req_valid && !mem_req_rw && mem_req_ready;