datapoint_id	invoice_arrival_date	country	rel_doc	text_features
0	14240	2022-01-03 18:09:53.421000+00:00	AU	True	{'num_of_rows': 98, 'num_of_punc_in_text_words...
1	35837	2021-01-18 13:07:49.108000+00:00	AU	True	{'num_of_rows': 19, 'num_of_punc_in_text_words...
2	32165	2021-11-05 00:06:48.725000+00:00	AU	True	{'num_of_rows': 47, 'num_of_punc_in_text_words...
3	56670	2021-04-05 19:08:41.746000+00:00	AU	True	{'num_of_rows': 9, 'num_of_punc_in_text_words'...
4	38372	2021-02-02 13:39:24.751000+00:00	AU	True	{'num_of_rows': 76, 'num_of_punc_in_text_words...

datapoint_id

invoice_arrival_date

country

rel_doc

text_features

14240

2022-01-03 18:09:53.421000+00:00

True

{'num_of_rows': 98, 'num_of_punc_in_text_words...

35837

2021-01-18 13:07:49.108000+00:00

True

{'num_of_rows': 19, 'num_of_punc_in_text_words...

32165

2021-11-05 00:06:48.725000+00:00

True

{'num_of_rows': 47, 'num_of_punc_in_text_words...

56670

2021-04-05 19:08:41.746000+00:00

True

{'num_of_rows': 9, 'num_of_punc_in_text_words'...

38372

2021-02-02 13:39:24.751000+00:00

True

{'num_of_rows': 76, 'num_of_punc_in_text_words...

\n", 532 | "\n", 545 | "\n", 546 | " \n", 547 | " \n", 548 | " \n", 549 | " \n", 550 | " \n", 551 | " \n", 552 | " \n", 553 | " \n", 554 | " \n", 555 | " \n", 556 | " \n", 557 | " \n", 558 | " \n", 559 | " \n", 560 | " \n", 561 | " \n", 562 | " \n", 563 | " \n", 564 | " \n", 565 | " \n", 566 | " \n", 567 | " \n", 568 | " \n", 569 | " \n", 570 | " \n", 571 | " \n", 572 | " \n", 573 | " \n", 574 | " \n", 575 | " \n", 576 | " \n", 577 | " \n", 578 | " \n", 579 | " \n", 580 | " \n", 581 | " \n", 582 | " \n", 583 | " \n", 584 | " \n", 585 | " \n", 586 | " \n", 587 | " \n", 588 | " \n", 589 | " \n", 590 | " \n", 591 | " \n", 592 | " \n", 593 | " \n", 594 | " \n", 595 | " \n", 596 | " \n", 597 | " \n", 598 | " \n", 599 | " \n", 600 | " \n", 601 | " \n", 602 | " \n", 603 | " \n", 604 | " \n", 605 | " \n", 606 | " \n", 607 | " \n", 608 | " \n", 609 | " \n", 610 | " \n", 611 | " \n", 612 | " \n", 613 | " \n", 614 | " \n", 615 | " \n", 616 | " \n", 617 | " \n", 618 | " \n", 619 | " \n", 620 | " \n", 621 | " \n", 622 | " \n", 623 | " \n", 624 | " \n", 625 | " \n", 626 | " \n", 627 | " \n", 628 | " \n", 629 | " \n", 630 | " \n", 631 | " \n", 632 | " \n", 633 | " \n", 634 | " \n", 635 | " \n", 636 | " \n", 637 | " \n", 638 | " \n", 639 | " \n", 640 | " \n", 641 | " \n", 642 | " \n", 643 | " \n", 644 | " \n", 645 | " \n", 646 | " \n", 647 | " \n", 648 | " \n", 649 | " \n", 650 | " \n", 651 | " \n", 652 | " \n", 653 | " \n", 654 | " \n", 655 | " \n", 656 | " \n", 657 | " \n", 658 | " \n", 659 | " \n", 660 | " \n", 661 | " \n", 662 | " \n", 663 | " \n", 664 | " \n", 665 | " \n", 666 | " \n", 667 | " \n", 668 | " \n", 669 | " \n", 670 | " \n", 671 | " \n", 672 | " \n", 673 | " \n", 674 | " \n", 675 | " \n", 676 | " \n", 677 | " \n", 678 | " \n", 679 | " \n", 680 | " \n", 681 | " \n", 682 | " \n", 683 | " \n", 684 | " \n", 685 | " \n", 686 | " \n", 687 | " \n", 688 | " \n", 689 | " \n", 690 | " \n", 691 | " \n", 692 | " \n", 693 | " \n", 694 | "

	rel_doc	num_of_rows	empty _spaces	characters_in_raw_invoice	words_raw_invoice_by_split	ascii_characters_in_invoice	...
0	True	98.0	349.0	2407.0	400.0	1954.0	...
1	True	19.0	16.0	172.0	30.0	131.0	...
2	True	47.0	184.0	1187.0	196.0	951.0	...
3	True	9.0	20.0	119.0	21.0	88.0	...
4	True	76.0	107.0	937.0	133.0	749.0	...

\n", 695 | "

5 rows × 50 columns

\n", 696 | "